第14讲数据仓库一、基本概念随着数据库技术的应用普及和发展,人们不再仅仅满足于一般的业务处理,而对系统提出了更高的要求:提供决策支持
数据库技术何谓数据仓库
一种面向分析的环境;一种把相关的各种数据转换成有商业价值的信息的技术
1、从数据库到数据仓库数据库系统能够很好的用于事务处理,但它对分析处理的支持一直不能令人满意
特别是当以业务处理为主的联机事务处理(OLTP)应用和以分析处理为主的DSS应用共存于一个数据库系统时,就会产生许多问题
例如,事务处理应用一般需要的是当前数据,主要考虑较短的响应时间;而分析处理应用需要是历史的、综合的、集成的数据,它的分析处理过程可能持续几个小时,从而消耗大量的系统资源
人们逐渐认识到直接用事务处理环境来支持DSS是行不通的
要提高分析和决策的有效性,分析型处理及其数据必须与操作型处理及其数据分离
必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境
数据仓库技术正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术
操作型数据分析型数据细节的综合的,或提炼的在存取瞬间是准确的代表过去的数据可更新不更新操作需求事先可知道操作需求事先不知道生命周期符合SDLC完全不同的生命周期对性能要求高对性能要求宽松一个时刻操作一个单元一个时刻操作一个集合事物驱动分析驱动面向应用面向分析一次操作数据量小一次操作数据量大支持日常操作支持管理需求数据仓库与决策支持系统(DSS)用户在进行决策制定时需要得到企业各方面的信息,因此用户一般首先根据各个业务部门数据库中的数据,创建数据仓库,存储各种历史信息和汇总信息
对数据仓库的进一步应用由功能强大的分析工具来实现
现在主要有三类分析工具可用于决策支持
第一类能够支持涉及分组和聚集查询,并能够对各种复杂的布尔条件、统计函数和时间序列分析提供支持的系统