元数据管理方案一
1元数据抽取为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取
通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息
1抽取的对象元数据抽取主要针对的对象有以下几种:已有目录:已建业务应用系统中现有的目录资源
数据库:各种数据库资源,包括关系型数据库、XML数据库等
格式化电子文件:电子文件,例如Word、PDF、XLS等文件
2元数据抽取的流程元数据抽取的流程有4个主要步骤,分别为:数据源信息获取:解决要从哪个数据源获得元数据的问题
内容/结构分析:解决要从数据源中获得哪些元数据的问题
元数据提取:解决如何从数据源中获取元数据的问题
存储入库:解决元数据存储的问题
3电子文档的元数据抽取对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理
针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程:整理归档对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的
但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目
各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的
在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可
根据安全级别,建立相应的访问机制由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信