6.1 数据仓库的基本原理6.2 数据仓库系统6.3 联机分析处理6.4 数据仓库的决策支持第六章 数据仓库 6.1 数据仓库的基本原理数据仓库的兴起1.“ 数据太多,信息不足”的现状2. 异构环境的数据源 据美国《幸福》杂志所列的全球 2000 家大公司中已有 90% 将 Internet 网络和数据仓库这两项技术列入企业计划。 数据仓库是 1995 年开始盛行起来的。6.1.1 数据仓库的概念 ( 1 ) W.H.Inmon 在《建立数据仓库》一书中,对数据仓库的定义为: 数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。1 、数据仓库的概念( 2 ) SAS 软件研究所定义: 数据仓库是一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。1 、数据仓库的概念 传统数据库用于事务处理,也叫操作型处理,是指对数据库联机进行日常操作,即对一个或一组记录的查询和修改,主要为企业特定的应用服务的。用户关心的是响应时间,数据的安全性和完整性。 数据仓库用于决策支持,也称分析型处理,用于决策分析,它是建立决策支持系统( DSS )的基础。操作型数据( DB 数据)与分析型数据( DW 数据)之间的差别为:DB 数据 DW 数据 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 2 、数据仓库特点( 1 )数据仓库是面向主题的 主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。 例如,银行的数据仓库的主题:客户 DW 的客户数据来源: 从银行储蓄 DB 、信用卡 DB 、贷款 DB 等三个 DB中抽取同一客户的数据整理而成。 在 DW 中分析客户数据,可决定是否继续给予贷款。2 、数据仓库特点( 2 )数据仓库是集成的 数据进入数据仓库之前,必须经过加工与集成。 对不同的数据来源进行统一数据结构和编码。统一原始数据中的所有矛盾之处,如字段的同名异义,异名同义,单位不统一,字长不一致等。 将原始数据结构做一个从面向应用到面向主题的大转变。2 、数据仓库特点( 3 )数据仓库是稳定的 数据仓库中包括了大量的历史数据。数据经集成进入数据仓库后是极少或根本不更新的。( 4 )数据仓库是随时间变化的 数据仓库内的数据时限在 5~10 年,故数据的键码包含时间项,标明数据的历史时期,这适合DSS 进行时间趋势分析。...