申工仲 II 借 L-E:1■即“片:\"*■---I数据集成()工具的设计与构建陈小菲经过几十年来快速不断的创新造就了大批综合性的、分布式的且不断变化的应用系统,这些系统跨越了从大型机到的多种平台,因此不同系统的互连成了亟待解决的问题。如何发挥这些系统中各种数据的作用,将不同应用系统的数据进行提炼、整合,并充分利用已有的技术及应用资源,建成一个完整的、可持续发展的集成系统,数据集成工具成为一种重要的技术,面对多种技术环境开发的基础业务系统,把业务数据迁移到综合业务系统和决策分析系统,并进行有效整合。数据集成工具主要包括以下几个过程:抽取、清洗、转换和加载等,本文中数据集成工具简称为工具。在实际项目中,本工具已开始实现研发和试用,本文将对工具的设计思想与功能实现等内容进行讨论。一、工具的功能目标本工具以各种技术环境开发的基础业务系统为基础,把业务数据迁移到综合业务系统和决策分析系统,并进行有效整合,建成一个完整的集成数据库系统,因此在企业应用集成()系统中,工具扮演着相当关键的角色,以下是数据集成模型图,箭头表示的数据迁移过程需要通过工具实现。、主要功能工具主要功能可分为两部分:数据集成配置和数据集成服务,具体如下:()数据集成配置:提供一个界面,使得用户能够通过界面的互动,比较容易地实现数据集成的流程、规则的定义;同时提供相应的解析功能,实现将配置规则进行解析,D链审Serve也书厂乩则业舊吋一^ORACLiff.:IntomiKfDIwise.爲?!L•数加抽取(堆础业务即今址憶 KJ-厂舗煤片、遒像库架集图数据集成模型r 一一址据架或 I 愦擦库今淙合吐务作孑数据仓昨}]!厂琴合业务叶、厂蠶■扣.仓.吟、精彩文档■-—_lx□□□□□□□□并对数据进行集成。最后能够定义并执行相应的抽取计划。()数据集成服务:提供相应的解析功能,实现对集成规则的解析,服务读取这些规则,生成集成任务,在后台进行运行数据集成。并且把这些集成信息发布出来,可以让其它集成工具进行信息共享。、特点()易用性:数据集成工具进行抽取任务配置时,比较繁锁,而本工具在进行抽取任务配置时可以做到简单易学,易用;同时配置操作也流程化,易于理解。()稳定性:本工具进行任务执行,保证抽取任务的正常进行。运行稳定,不轻易发生系统错误,不轻易发生程序死机。()可靠性:本工具进行任务抽取时,能可靠地完成抽取,源数据到目标数据的抽取误差低于%,对于因特殊情况无法进行抽取...