下载后可任意编辑数据仓库技术在企业信息系统建设中的应用谢新建 宋晔 ( 北 京 理 工 大 学 计 算 机 科 学 系 , 北 京 100081)摘要:本文从建设原则、体系结构、关键环节等几个方面并结合某电信运营商的具体案例说明了数据仓库技术在国内电信业的应用,其中重点说明了异种数据源集成、ODS 层的设计、ETL 过程的设计、仓库模型设计、元数据管理以及专题数据挖掘等关键环节,对企业数据仓库项目的工程实施有一定的参考价值。关键词: 数据仓库;ETL;元数据;遗留系统中图分类号: TP311 文献标识码:A 1、引言数据仓库技术是经过了十几年的讨论与进展,在理论与工程实践上都取得了显著的成果。国际上许多重要的学术会议,如超大型数据库国际会议(VLDB),数据工程国际会议(Data Engineering)等,都出现了大量专 门 讨 论 数 据 仓 库 ( Data Warehousing ) 、 联 机 分 析 处 理 ( On-Line Analytical Processing)、数据挖掘(Data Mining)[1]的论文,同时各大数据 库 厂 商 纷 纷 推 出 相 应 产 品 支 持 数 据 仓 库 , 比 如NCR、SAS、Oracle、IBM、Informix、Sybase 等都提出了相应的数据仓库下载后可任意编辑解决方案;另一方面 ,随着信息技术的飞速进展,企业内部产生了越来越多的数据,但这些数据并没有产生应有的信息,为此出现了“数据爆炸,知识贫乏”的窘迫局面,有效地整合与充分利用现有的信息资源成为企业提高核心竞争力的关键。本文以电信行业为例分析了企业经营分析与决策支持系统的建设应用,重点阐述数据仓库相关技术。2、数据仓库系统的设计2.1、系统设计原则 (1) 通用化性原则 企业各地分支机构在组织构架、业务划分与侧重、其所运行的OLTP 系统所依赖 RDBMS、电信数据综合分析与决策支持系统所需要的数据源的类型与格式等不尽相同,这些都在企业数据综合分析与决策支持系统通用化设计的考虑范围之内。(2) 可扩展性原则随着业务内容的变化,业务系统的信息范围会发生变化,而对于作为统一信息服务平台应设计性能良好的体系结构,保证系统灵活的功能可扩展性。即在保持系统架构与原业务分析逻辑的前提下,系统能实现简洁的分析主题与功能性扩充。 (3) 技术开放性原则为保护用户投资,通过透明访问技术,要保证系统能够独立于具体平台工具,对用户形成统一的功能和界面。在工具和平台的选择上给用户提供自由选择的最大余地。 (...