数据仓库技术概述数据仓库技术随着数据库技术的日趋成熟以及应用系统逐渐完善,无论是利用早期的RDB、Dbase,还是后来以其领先的核心技术日渐垄断关系数据库市场的Oracle、Sysbase、DB2,企业已经积累了大量的数据,这些数据信息为企业的发展提供了客观依据
毫无疑问,在竞争激烈的商业环境下,信息将是取胜的关键因素,决策者必须能快速可靠、随时自主地访问企业数据,才能有效地做出计划和决策
在这种需求牵引下,形成了数据仓库(DataWarehouse)的新概念、新技术
1数据仓库的概念数据仓库的提出是以关系数据库、并行处理和分布式技术的飞速发展为基础,是解决信息技术(IT)在发展中存在的拥有大量数据,而其中有用信息贫乏的综合解决方案
数据仓库是一种新的数据处理体系结构,是对企业内部各部门业务数据进行统一和综合的中央数据仓库
它为企业决策支持系统(DSS)和经理信息系统(EIS)提供所需的信息
它是一种信息管理技术,为预测利润、风险分析、市场分析以及加强客户服务与营销活动等管理决策提供支持的新技术
数据仓库技术对大量分散、独立的数据库经过规划、平衡、协调和编辑后,向管理决策者提供辅助决策信息,发挥大量数据的作用和价值
概括地说,数据仓库是面向主题的(Subject-Oriented)、集成的(Integrated)、稳定的(Nonvolatile)、不同时间的(Timer-Variant)数据集合,用于支持经营管理中决策制订过程
数据仓库中的数据面向主题,与传统数据库面向应用相对应
主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域:数据仓库的集成特性是指在数据进入数据仓库之前,必须经过数据加工和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变;数据仓库的稳定性是指数据仓库反映的是历史数