数据仓库技术在企业信息系统建设中的应用谢新建宋晔(北京理工大学计算机科学系,北京100081)摘要:本文从建设原则、体系结构、关键环节等几个方面并结合某电信运营商的具体案例说明了数据仓库技术在国内电信业的应用,其中重点说明了异种数据源集成、ODS层的设计、ETL过程的设计、仓库模型设计、元数据管理以及专题数据挖掘等关键环节,对企业数据仓库项目的工程实施有一定的参考价值
关键词:数据仓库;ETL;元数据;遗留系统中图分类号:TP311文献标识码:A1、引言数据仓库技术是经过了十几年的研究与发展,在理论与工程实践上都取得了显著的成果
国际上许多重要的学术会议,如超大型数据库国际会议(VLDB),数据工程国际会议(DataEngineering)等,都出现了大量专门研究数据仓库(DataWarehousing)、联机分析处理(On-LineAnalyticalProcessing)、数据挖掘(DataMining)[1]的论文,同时各大数据库厂商纷纷推出相应产品支持数据仓库,比如NCR、SAS、Oracle、IBM、Informix、Sybase等都提出了相应的数据仓库解决方案;另一方面,随着信息技术的飞速发展,企业内部产生了越来越多的数据,但这些数据并没有产生应有的信息,为此出现了“数据爆炸,知识贫乏”的窘迫局面,有效地整合与充分利用现有的信息资源成为企业提高核心竞争力的关键
本文以电信行业为例分析了企业经营分析与决策支持系统的建设应用,重点阐述数据仓库相关技术
2、数据仓库系统的设计2
1、系统设计原则(1)通用化性原则企业各地分支机构在组织构架、业务划分与侧重、其所运行的OLTP系统所依赖RDBMS、电信数据综合分析与决策支持系统所需要的数据源的类型与格式等不尽相同,这些都在企业数据综合分析与决策支持系统通用化设计的考虑范围之内
(2)可扩展性原则随着业务内容的变化,业务系