数据仓库一数据仓库简介随着处理信息量的不断加大,企业需要多角度处理海量信息并从中获取支持决策的信息,面向事务处理的操作型数据库就显得力不从心,面向主题集成大量数据的数据仓库技术产生
数据仓库因其面向主题性,集成性,稳定性和时变性,不仅在数据的集成,存储上效果好,在从操作系统提取信息和支持系统造作者的前端工具上更是充分利用了数学严谨的逻辑思维和统计学知识,以及先进的信息技术,使企业的信息利用更有价值
数据仓路按照特定的方法(ETL)从数据源中提取数据,以特定主题作维度利用特定的算法集成数据给数据用户提供实时查询,最终集成有效信息供决策者使用
数据仓库是个过程而不是一个项目,是一个解决方案而不是一个产品
数据仓库之父比尔·恩门(BillInmon)在1991年出版的“BuildingtheDataWarehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受,数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策
二数据仓库历史1
1981年NCR公司(nationalcashregistercorporation)为Walmart建立了第一个数据仓库,总容量超过101TB(十年的会计文档还不足1TB)2
商务智能的瓶颈是从数据到知识的转换
1979年,一家以决策支持系统为已任、致力于构建单独的数据存储结构的公司Teradata诞生了
Tera,是万亿的意思,Teradata的命名表明了公司处理海量运营数据的决心
1983年,该公司利用并行处理技术为美国富国银行(WellsFargoBank)建立了第一个决策支持系统
这种先发优势令Teradata至今一直雄居数据行业的龙头榜首
1988年,为解决企业集成问题,IBM公司的研究员