办公室文档的信息化陈访荣(宁波广播电视大学,浙江宁波315016)【摘要】本文从“办公室文档”现象出发,倡导办公室文档的信息化,论述了办公室文档信息化的原则,文档信息化的可行方案与技术走向,并以最新的XML载体例举了文字档案的处理。【关键词】办公室文档,信息化,网页,XML【中图分类号】TP317.1【文献标识码】A【文章编号】1672-3724(2004)02-0033-03ComputerizationofOfficeDocumentsCHENFang-rong(NingboRadioandTVUniversity,Ningbo315016,Zhejiang,China)Abstract:Fromthephenomenaof“officedocuments”,thispapercallsforthecomputerizationoftheofficedocuments,discussestheprincipleofthesedocuments,pointsoutthatthecomputerizationisbasedonworkableschemesandtechnologies,andlastlyprovidesthelatestXMLexamplesofprocessingwordfiles.KeyWords:Officedocuemts;Computerization;Webpage;XML文字档案是人类文明史上最卓越的信息载体,它是在一定的媒介上承载文字信息的。从远古的甲骨、陶、碑、简、帛,到纸介时代,直至电、磁、光介质的普遍使用,媒介技术的每次变迁,都极大地推动了和推动着文档内涵、功效、记录成本和传播途径与速度的发展变化。现在的办公室文档编制普遍存在信息价值低、传播成本高、一致性差等缺陷,急需进行信息化改造,使之成为在线资讯,并组织应用开发,增加对文档的复用和挖潜。信息化的典型误区——“办公室文档”现象单位或部门的业务活动大多围绕一系列的信息(如生产信息、管理信息、营销信息、决策信息等等)而展开,运用信息技术进行信息的辅助管理,是现代管理学的重要内容。在所有的计算机辅助信息管理业务中,数字化文档始终是信息的基本载体。因此,数字化文档的编制水平对IT(信息技术)应用水平起着关键性的作用。信息化文档编制的基本要求是,能够运用现有的成熟技术(如数据库技术)对文档进行深加工而产生较大量新信息、新认识,从而推动科学决策。总的来说,就是以数据库、超媒体文本为主要媒介形式,按数据源或数据所有权组织布局,并建立网状分布的索引、加工,形成多层次、多角度、实时、协同的信息整理和分析。但现在很多部门的文档编制,只是简单地将传统的纸介文档通过电脑打字转存到数字化设备上,然后通过排版打印得到“美容”了的纸介文档。其典型特征是:桌面字处理和编辑排版软件一统天下;打印稿成堆却鲜有备份磁盘、光盘……我们把这种现象称作“办公室文档”现象。其实,“办公室文档”除了第一次效益(美容文稿)和第一种效益(原样重复使用)外,较难产生第二种效益。这是因为在前沿科技(如模式识别、数据挖掘、文字理解等)尚未发展成熟的现实情况下,“办公室文档”只能通过人的智能活动(阅读识别、分析感受、总结概括等)产生新信息。所以“办公室文档”的信息价值低、传播成本高、一致性差,急需进行信息化改造,使之成为在线资讯,并组织应用开发,增加对文档的复用和挖潜。文档信息化三原则从格式密集型转向文字密集型,以提高文档的复用水平“办公室文档”的最大特点,是文档的格式信息非常密集而文字信息相对疏松。但除了换行标识、段落标识等少量的格式信息外,象版面布局、文字修饰等占据极大比重的格式信息只有打印到纸介(或显示到屏幕)时才有信息价值。这意味着在打印以外的应用中,此类文档的信息冗余度是很高的。事实上,在管理应用中文档格式并不需要设计得很复杂。文档中的输出格式信息就象是电磁通讯中的干扰波,如果“干扰波”很弱,则我们能较容易地、更多样地对文档内含的文字信息进行挖掘、应用,使之产生更丰富的效益。现代计算技术将文字进行数字化编码(如西文的ASCII码、汉字的国标区位码、UNICODE全球统一编码等),运用电路技术、电磁技术、光电技术等存放在电子记忆体、磁盘、磁带、光盘等媒介上,并通过计算机中的字库和特定功能程序,将编码所代表的文字外形显示在计算机屏幕上,或打印到其它媒介上。字库就是记录文字的外形图案的数据集合。(如图1所示)通过约定的格式将文字的数字编码组织在一起,就形成了数字化文档。数字化文字档案与传统文字档案...