电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

数据挖掘与数据仓库-知识点总结

数据挖掘与数据仓库-知识点总结_第1页
1/7
数据挖掘与数据仓库-知识点总结_第2页
2/7
数据挖掘与数据仓库-知识点总结_第3页
3/7
1、数据仓库定义:数据仓库是一种新的数据处理体系结构,它与组织机构的操作数据库分别维护,允许将各种应用系统一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。数据仓库 是面对主题的、集成的、相对稳定的、反映历史变化的数据集合,为企业决策支持系统提供所需的集成信息。设计和构造步骤:1)选取待建模的商务处理;2)选取商务处理的粒变;3)选取用于每个事实表记录的维;4)选取事实表中每条记录的变量系统结构:(1)底层是仓库数据服务器,总是关系数据库系统.(2)中间层是 OLAP 服务器,有 ROLAP 和MOLAP,它将对多维数据的操作映射为标准的关系操作(3)顶层是前端客户端,它包括查询和报表工具、分析工具和数据挖掘工具2、数据仓库的多维数据模型:(1)星形模式:在此模型下,数据仓库包括一个大的包含大批数据并且不含冗余的中心表,一组小的附属表,维表围绕中心事实表显示的射线上.特征:星型模型四周的实体是维度实体,其作用是限制和过滤用户的查询结果,缩小访问范围。每个维表都有自己的属性,维表和事实表通过关键字相关联。【例子:sales 数据仓库的星形模式,此模式包含一个中心事实表 sales,它包含四个维 time, item, branch 和 location。(2)雪花型模式:它是星形模式的变种,其中某些维表是法律规范化的,因而把数据进一步分解到附加的表中.特征:雪花模型通过最大限度地减少数据存储量和联合较小的维表来改善查询性能,增加了用户必须处理的表数量和某些查询的复杂性,但同时提高了处理的灵活性,可以回答更多的商业问题,特别适合系统的逐步建设要求。【例子同上,只不过把其中的某些维给扩展了。(3)事实星座形:复杂的应用可能需要多个事实表共享维表,这种模式可看作星形模式的汇合。特征:事实星座模型能对多个相关的主题建模。例子:有两个事实表 sales 和 shipping,它们可以共享维表 time, item 和 location。3、OLAP:即联机分析处理,是在 OLTP 基础上进展起来的、以数据仓库基础上的、面对高层管理人员和专业分析人员、为企业决策支持服务。特点:1.实时性要求不是很高。2。数据量大。3。因为重点在于决策支持,所以查询一般是动态的,也就是说允许用户随机提出查询要求.OLAP 操作:上卷:通过沿一个维的概念分层向上攀登,或者通过维归约,对数据立方体进行类聚。下钻:是上卷的逆操作,它由不太详细的数据得到更详细的数据,下钻可以通过沿维的概念分层向下或引入附加的维来实现。...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

数据挖掘与数据仓库-知识点总结

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部