|
|
|
办公自动化基本知识
|
第二章 办公自动化技术与设备:个人办公自动化(下)
四、数据仓库软件系统
(一) 数据仓库的概念
数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的和不同时间的数据集合。
所谓面向主题的数据库是经过科学规划和设计而建立起来的具有共享性和一致性的数据环境。其特点是面向组织的目标主题,而不是按用户视图建立的面向一般应用项目业务,其数据结构和存储方式独立与职能区域和业务过程。
与传统的面向文献型的数据库处理技术不同,数据仓库是对于分散在不同的系统、不同的应用程序中,具有不同的格式的数据的获取、相互关联和解释的以单位或专业为对象的数据库综合性处理技术,它允许用户访问综合的面向对象存储的大量历史数据,可把若干不同来源中取得的数据统一到一个易于使用的参考数据库中,可为用户提供专业化的信息和指导,它形成了对象综合性决策支持系统的核心。可根据不同类型的业务信息(决策人员必知的)组织来自众多应用的基于时间的信息;可包括种类繁多的信息以满足不同用户的不同需求;还可包括单一类型的信息,以满足某一特定用户群的特殊需求。
(二) 数据仓库的结构
由若干层逻辑结构组成,从传统数据库及数据文件中获取原始数据后按辅助决策的主题要求形成当前基本数据层;在基本层的基础上按综合决策要求形成综合数据层;随着时间的推移由时间控制机制将当前基本层转为历史数据层。
(三) 数据仓库系统
由数据仓库、仓库管理和分析工具组成。其中仓库管理负责对确定的数据需求进行数据的建模、数据的抽取、清理和转换,最后确定数据仓库的物理存储结构。分析工具是用于实现决策支持功能的各种工具。
(四) 数据集市
是一种特定作用的数据仓库工具。它具有规模小面向特定应用和特定部门,开发和维护方便,易于升级等种种优点,因而被广泛应用。
(五) 数据仓库开发过程
数据仓库不是一种现成的产品而是需要业务部门和技术部门协同进行再开发才能实际应用的产品。其开发的具体过程如下:
系统规划:确定工程目标及计划。包括数据范围、来源、技术设备、人员培训及工程进度等。
建立技术环境:确定所需软件和硬件资源,包括开发平台、开发工具网络通信环境和服务水平目标等。
确定主题与数据建模:根据决策需求确定主题、选择数据源、设计数据逻辑结构。
设计数据仓库中的数据:根据用户需求确定主题、,设计数据仓库的物理结构。
设计数据转换程序:即对数据的抽取、清理、格式化、综合和装载等过程的设计和编码。
管理元数据:即定义、表示数据的意义和协同个组成部分之间的关系
开发决策分析工具:面向用户的决策工具,包括优化查询工具、统计分析工具、多维数据分析工具以及数据采掘工具等。
管理数据仓库:对数据仓库本身的质量检测、维护、数据更新等工作。
五、电子报表软件
(一) 电子报表的概念
电子报表是由工作簿、工作表和单元格构成的数据动态管理软件系统。其中,单元格是数据处理的最小单位,其地址由列和行坐标标识。单元格构成工作表,一个典型的工作表有256列×16384行,是一个相当大的区域,用户可在工作表中选择多个独立或相关的小工作区域,必要时由系统对其进行联系、汇总等处理。若干个工作表组成一个工作簿,就如同一本书由若干页构成一样,可在工作簿中翻页查看各工作表并对其进行增、删和前后调整。一个工作簿是一个独立的计算机文件。
(二)电子报表软件功能
可在单元格中填入、整理和存储数据,可通过系统提供的功能强大丰富的函数及自建的公式对工作表进行运算,还可以使用数据透视功能根据用户的要求对工作表进行方便、灵活的汇总处理,数据透视表功能可以生成手工情况下要化很多功夫作很麻烦的处理才能完成的复杂的汇总表,而在电子报表软件下经过简单操作就可生成具有相关的地图和统计图形的图文并茂的图表。此外,电子报表还可以与数据库及其它软件交换和共享数据。
第三节 多媒体实用技术
一、多媒体微机
(一)多媒体微机的概念
信息的表现形式多种多样,如文字、图形、声音、动画、活动影像等。不同表现形式的信息称为不同的信息媒体。多媒体计算机技术是指计算机交互式综合处理各种媒体信息,并将各种信息建立逻辑连接,集成为一个系统并具有交互处理能力,能同时捕捉、处理、存储和展示多个不同类型信息媒体的微机称为多媒体微机(MPC)。
(二)多媒体微机的配置
多媒体微机一般配置只读光盘CD-ROM以存储多媒体信息。CD-ROM根据传输数据的速率不同需配置各种倍速的驱动器。此外还需配置声卡以实现数字信号与声波的相互转换,以便播放和录制音响数据。配置解压缩装置用来还原图像信息,这样才可以在多媒体微机上看到图像。其中图像处理是多媒体微机处理能力的关键。图像处理能力由下述概念体现:象素,是构成图象的最小单位;分辨率,是每桢能显示的象素,例如VGA标准显示器的分辨率为640×480,SVGA为1024×768;颜色,计算机当前能显示的颜色,最多256色。这些性能集中体现在彩色显示卡的指标上,例如,总线类型的显示卡(VESA/PCI,数据传输位数32/64位)分辨率(640×480、1024×768)存储器容量(2M以上)标识了它的图像处理能力和显示速度(每秒能显示的桢数)。此外压缩(不存储图象的每一位原始信息而是存储图象的变化规律信息的存储方法,在显示时需要用解压算法软件恢复原始图象)与解压方式也是图像处理的重要内容。
(三)多媒体微机发展的关键技术
有赖于以下技术设备的市场产品的发展,即在性能与价格比方面的不断优化:传递多种信息媒体的输入输出技术与设备、处理多媒体信息所要求的高速度技术软件、海量存储技术、数据压缩与还原技术、多媒体编辑技术等。
(四)可视计算机环境
提供视频、语音的同步传输及应用共享的计算机通信环境,基于计算机强大的多媒体功能和通信网络的基础上。据认为,在下个世纪初,90%以上的企业和其他部门会在可视环境中进行交易,包括企业与用户、企业之间。
二、汉字识别技术与产品
(一)模式识别技术的概念及其应用
模式识别就是将事件和过程进行分类和鉴别的技术。它把一种要研究的对象根据某些特征进行识别并分类。例如要识别写在卡片上的数码字,判断它是0、1、2......9中的哪个数字,就是将数码字图象分成十类的问题。计算机识别数码字可解决信件邮政编码的自动分拣问题。计算机应用的发展,可以把不同的对象图象化或模式化,例如汉字、心电图与地震波等波形图、遥感遥测照片等等。模式识别技术使得计算机能执行某种类似于专家水平的任务或者某种智能化的活动。
(二)汉字识别技术
是一种文字自动输入方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,也可使用联机手写方式识别写在手写板上的汉字,然后利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。OCR是一种快捷、省力的文字输入方式,是在有大容量文字录入的场合可采用的替代方法。它可缩短录入时间,减轻劳动强度,提高录入的正确率,提高工作效率。具有以下实用产品:
1.联机手写体汉字识别系统(手写板):适用于不愿或不便使用键盘输入汉字的计算机操作者。除了用手写笔写汉字外,还能签名、绘图、保留手迹和代替鼠标。手写方式不会打断思维,基本不用停下来选择候选字,可以连续书写,识别后的字显示在屏幕上,每分钟30-50字,适合普通人使用,具有自学习功能,对于特定用户能不断提高识别率。
2.脱机汉字文本自动识别(OCR:Optical Character
Recognition):可分为印刷体文稿识别和手写体文稿识别。对印刷体文稿的识别系统,目前先进的产品,识别速度在每秒35-40字以上,扫描仪扫描线在每英寸300线以上,字迹清晰的铅印或胶印文本的识别率可达99%。手写体文稿的识别率,对工整的文稿识别率可达90%,一般工整程度可达80%。
智能化的OCR系统具有自学习功能,可以不断适应用户的写法习惯,只要用户的笔迹变化不大,经学习一段时间以后,可识别较潦草的字迹。
三、语音处理系统
(一) 语音识别技术与产品
1. 语音识别概念:是计算机应用人工智能技术将人的语音自动转换为文字和指令、使计算机具备听觉功能的技术方法。
2.影响识别的要素:语音识别技术的复杂性和指标取决于三方面的技术,发音方式,发音时是以孤立词、连结词或自然语言的连续语音的方式;字表的大小,可识别的字符范围,分为大、中、小不同类型;适用对象,分为特定人和非特定人系统。特定人系统指训练与识别是适用于同一人,非特定人系统则是指语音样板能适应一组人进行识别,即训练时为特定人,而识别时能适应一组人。
技术现状与产品:目前实用化的非特定人连续语音识别系统已投入应用。
(二)语音合成
语音合成技术是计算机模仿人的语音生成过程,使计算机控制音响设备合成人工语音。目前人工合成的语音的可懂度、自然度和保真度都相当好,广泛应用于许多计算机产品中。
四、电子地图(GPS)技术:由其提供的地图能实时地提供精确度为厘米级的三维地形信息及时间信息。其最基本功能是能够确定位置和时间,还可提供卫星导航服务,它与其他系统结合形成日益扩大的应用市场例如资源管理、环境实时监测、交通定位管理、精密农业等等。其产品价格也日趋合理,例如,目前手提式GPS已下降到200美元以下,使个人也能够配备。
五、虚拟现实与电信社会
多媒体技术尚处于起步阶段,随着技术的发展走向,其革命性的影响是虚拟现实技术的广泛应用,虚拟现实技术创建出各种以假乱真的情境,它与全球的网络化相联系,将对我们的世界与我们的生活产生根本性的变革作用。
具体而言,虚拟现实技术是应用多媒体计算机及其它技术设备为使用者构建出一个感觉上真实的而实际上不存在的情景。虚拟现实技术的发展会在基础理论和社会应用各领域产生巨大的影响,例如,它会使人类对世界的认识方式、人类与物质世界间的交流手段、人类社会之间的交流和组织方式等各方面产生根本性的变化,它还会导致被称为“电信社会”的社会形态变化。所谓电信社会是在人类社会中产生的无实体但却具有现实社会所具有的种种特征的社会。例如:由网络连结的强大的有共同兴趣的利益实体,虽然它们无地理国界,但同现实社会一样会增长或产生纷争和动荡,它们还会对地理上的社会产生经济、政治以及文化上的重大影响,特别是这些影响是以现有情况下无法阻挡的方式所产生和形成的,换言之,是受新技术的驱动而产生的。人类尚无法估量其未来走势的具体轮廓,目前所能作的是寻找现实与虚拟二者之间的黏合剂。
第四节 人工智能技术
一、人工智能技术概念及应用领域
人工智能技术是研究人类智能和如何使机器具有人的智能行为的科学,通常利用计算机模拟人的思维、语言、记忆、推理、感知、学习等智能能力,以延伸人的感觉和大脑功能。它与计算机科学、自动化技术、心理学、语言学、数理逻辑、控制论、信息论、仿生学、哲学等学科有密切关系。是一门综合性边缘学科。其研究课题主要包括定理证明、博弈、问题求解、自动程序设计、机器翻译、模式识别、自然语言理解、专家系统、自学习系统、智能机器人等领域。
二、机器翻译
(一)机器翻译的概念与过程
1 机器翻译的概念:是应用计算机实现自然语言之间的转换的过程,其核心内容在于根据某种规则对语法信息、语义信息的处理。当前,对机器翻译产品尚不能作出较高的评价,在这方面人类还有很多工作要作。机器翻译专家吴蔚天介绍了机器翻译过程和价值评价方法:
2.机器翻译的过程
符号学阶段,根据字典进行的词的转换;
语言学阶段,根据语法、语言环境和语义背景知识进行的内容理解方面的转换;
社会语言学阶段,根据语言特点、社会风俗等知识进行的非字面范围的文字重写的转换;
质量评估阶段,根据原文作等值校对,在不同层面上有不同的等值标准。
(二)机器翻译的等值标准
分四个层次,由低到高简述如下:
1.词义等值层次:原文的词与译文的词不仅是在字典上等值,而且在一词多意的情况下在具体的语言环境下等值;
2.语法等值层次:指语法成分及其间的关系的等值,要求原文与译文在主、谓、宾、动、状、补诸方面等值并符合译文的语法顺序;
3.语义等值层次:由于社会风俗与习惯的不同,虽然原文与译文在用词与句型方面可能有差异,但以句子为单位的语义之间要相吻合;
4.话语等值层次:这是从总体上衡量词义与句义的等值程度,使译文与原文在文笔、语感、韵味诸方面得到较满意的评价。
三、专家系统的概念
专家系统是一种基于知识的智能推理计算机程序系统。它涉及对知识的获取、知识库技术、推理控制机制的建设和智能化的人--机界面的研究,集人工智能和领域知识于一体。它能模拟专门领域中专家求解问题的能力,对所面临的复杂问题,作出专家水平的结论。它应用人工智能技术,将各领域专家的知识和经验以适当的形式存入计算机,利用类似专家的思维规则,对事例的原始数据进行逻辑的或可能性的推理、演绎,作出判断和决策。一般而言,专家系统由知识库(存储规则与事实)、推理机(实施推理、控制)、知识获取子系统、知识解释子系统和用户界面等部分构成。 |
|
|