数据挖掘——概念概念与技术 DataMining Concepts and Techniques 习题解答 Jiawei Han Micheline Kamber 著 范明孟晓峰译 1
3 假设你是BigUniversity 的软件工程师,任务是设计一个数据挖掘系统,分析学校课程数据库
该数据库包括如下信息:每个学生的姓名、地址和状态(例如本科生或研究生)、所修课程以及他们的GPA(平均积分点)
描述你要选取的结构
该结构的每个成分的作用是什么
答:该应用程序的数据挖掘的体系结构应包括以下主要组成部分: 数据库,数据仓库,万维网或其他信息库:这是一个或一组包含学生和课程信息数据库、数据仓库、电子表格或其他类型的信息库; 数据库或数据仓库服务器:根据用户数据挖掘请求,数据库或数据仓库服务器负责提取相关数据; 知识库:这是领域的知识,用于指导搜索或评估结果模式的兴趣度
数据挖掘引擎:这是数据挖掘系统的基本部分,理想情况下由一组功能模块组成,用于执行特征化、关联和相关分析、分类、预测、聚类分析、离群点分析和演变分析等任务
模式评估模块:该成分使用兴趣度度量,并与数据挖掘模块交互,以便将搜索聚焦 在 有 兴趣的模式上
用户界 面 :该模块在 用户和数据挖掘系统之 间 通 信,允 许 用户与系统交互,说 明 挖掘查 询 或任务,提供信息以帮 助 搜索聚焦 ,根据数据挖掘的中 间 结果进 行探 索式数据挖掘
4 数据仓库和数据库有 何 不 同
有 哪 些 相似 之 处
p8 答:区 别 :数据仓库是面 向 主题 的,集 成的,不 易 更 改 且 随 时 间 变化的数据集 合 ,用来 支 持 管 理人 员 的决 策 ,数据库由一组内 部相关的数据和一组管 理和存 取数据的软件程序组成,是面 向 操 作型的数据库,是组成数据仓库的源 数据