电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

数据挖掘_概念与技术部分习题答案

数据挖掘_概念与技术部分习题答案_第1页
1/21
数据挖掘_概念与技术部分习题答案_第2页
2/21
数据挖掘_概念与技术部分习题答案_第3页
3/21
1、4 数据仓库与数据库有何不同?有哪些相似之处?答:区别:数据仓库就是面对主题得,集成得,不易更改且随时间变化得数据集合,用来支持管理人员得决策,数据库由一组内部相关得数据与一组管理与存取数据得软件程序组成,就是面对操作型得数据库,就是组成数据仓库得源数据。它用表组织数据,采纳 E R数据模型。相似:它们都为数据挖掘提供了源数据,都就是数据得组合。1、3 定义下列数据挖掘功能:特征化、区分、关联与相关分析、预测聚类与演变分析.使用您熟悉得现实生活得数据库,给出每种数据挖掘功能得例子。答:特征化就是一个目标类数据得一般特性或特性得汇总。例如,学生得特征可被提出,形成所有大学得计算机科学专业一年级学生得轮廓,这些特征包括作为一种高得年级平均成绩(GPA:Grade point aversge)得信息,还有所修得课程得最大数量.􀁺 区分就是将目标类数据对象得一般特性与一个或多个对比类对象得一般特性进行比较。例如,具有高GPA 得学生得一般特性可被用来与具有低GPA 得一般特性比较.最终得描述可能就是学生得一个一般可比较得轮廓,就像具有高GPA 得学生得75%就是四年级计算机科学专业得学生,而具有低GPA 得学生得65%不就是。􀁺 关联就是指发现关联规则,这些规则表示一起频繁发生在给定数据集得特征值得条件。例如,一个数据挖掘系统可能发现得关联规则为:major(X, “puting science") ⇒ owns(X, “personal puter”)[support=12%, confidence=98%] 其中,X 就是一个表示学生得变量。这个规则指出正在学习得学生,12%(支持度)主修计算机科学并且拥有一台个人计算机。这个组一个学生拥有一台个人电脑得概率就是98%(置信度,或确定度)。􀁺 分类与预测不同,因为前者得作用就是构造一系列能描述与区分数据类型或概念得模型(或功能),而后者就是建立一个模型去预测缺失得或无效得、并且通常就是数字得数据值。它们得相似性就是她们都就是预测得工具:分类被用作预测目标数据得类得标签,而预测典型得应用就是预测缺失得数字型数据得值。􀁺 聚类分析得数据对象不考虑已知得类标号。对象根据最大花蕾内部得相似性、最小化类之间得相似性得原则进行聚类或分组。形成得每一簇可以被瞧作一个对象类.聚类也便于分类法组织形式,将观测组织成类分层结构,把类似得事件组织在一起.􀁺 数据演变分析描述与模型化随时间变化得对象得规律或趋势,尽管这可能包括时间相关数据...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

数据挖掘_概念与技术部分习题答案

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部