数据仓库方案对比 1 概述 成功地实施一个数据仓库项目,通常需要很长的时间。如果仅仅着眼于短期成果,缺乏整体考虑,采用一种不健全的体系结构,不仅会增加系统开发和维护成本,而且必将对发挥数据仓库的作用造成不利的影响。 Oracle公司是世界上最大的数据仓库厂家,能够提供完整的数据仓库解决方案。根据第三方专业咨询机构 TDWI-Forrester所做的市场调查显示,Oracle是大多数 IT主管选择数据仓库平台时的首选。 IBM 数据仓库的市场占有率低于 Oracle。权威市场分析机构 IDC 发布《全球数据仓库平台工具 2006 年度供应商市场份额》报告,根据 2006 年度软件收入,把甲骨文评为数据仓库平台工具领域的领先供应商(数据仓库平台工具包括ETL 工具、数据仓库存储平台、多维数据库、前端展现工具)。IDC 把甲骨文评为数据仓库管理领域的领先供应商,是因为甲骨文的市场份额已接近 41%。在数据仓库管理工具市场,甲骨文排名最近的竞争对手的各项指标几乎只有甲骨文的一半,市场份额仅占 22.8%。下图是另一家权威市场分析机构 GartnerMySQL,Microsoft SQL44.14%21.03%17.93%8.62%2.76%1.72%1.72%1.72%0.00%10.00%20.00%30.00%40.00%50.00%PostgreSQL,etcSybaseInformixOtherTeradataIBM DB2ServerOracle 的数据仓库象限图: IBM 同样低于Oracle。 2 E T L 工具 IBM 的ETL 工具有三个:收购的DataStage(通常市场上说的IBM 的ETL 工具指的就是Datastage,不提供增量数据捕获功能,价格昂贵),数据联邦工具:Information Integrator(异构连接性好、提供增量数据捕获功能,但是不提供完整的数据源到目标数据库的ETL 功能,尤其是数据转换功能很弱,没有ETL 步骤打包、流程编排功能,没有按照事件或者时间触发 ETL 流程的功能,价格昂贵),包在 Data Warehou se Edition 中的ETL 工具SQL Warehou sing(功能很弱,异构连接性差,不提供增量数据捕获,是一个新工具,没有什么用户,不是IBM 的主流 ETL 工具)。 功能点 使用场景或者益处 Oracle IBM 增量数据捕获 增量数据加载时,如果数据源系统没有时间戳,或者时间戳不可靠,需要利用读取数据源系统日志或者触发器方式获取增量数据,然后根据需要可以复制到目标数据库上或者批量同步到目标数据库上。 Oracle Data Integrator,对于Oracle 数据库和DB2 400 可以采用读取日志方式,其他数据库采用触发器方式 Information Integrator提...