填空或简答:1. 数据、信息和知识是广义数据表现的不同形式。2. 主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识3. web 挖掘讨论的主要流派有:Web 结构挖掘、Web 使用挖掘、Web 内容挖掘4. 一般地说,KDD 是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理、.数据挖掘以及模式评估等基本阶段。5. 数据库中的知识发现处理过程模型有:阶梯处理过程模型,螺旋处理过程模型,以用户为中心的处理结构模型,联机 KDD 模型,支持多数据源多知识模式的 KDD 处理模型6. 粗略地说,知识发现软件或工具的进展经历了独立的知识发现软件、横向的知识发现工具集和纵向的知识发现解决方案三个主要阶段,其中后面两种反映了目前知识发现软件的两个主要进展方向。7. 决策树分类模型的建立通常分为两个步骤:决策树生成,决策树修剪。8. 从使用的主要技术上看,可以把分类方法归结为四种类型:a) 基于距离的分类方法b) 决策树分类方法c) 贝叶斯分类方法d) 规则归纳方法9. 关联规则挖掘问题可以划分成两个子问题:a) 发现频繁项目集:通过用户给定 Minsupport ,寻找所有频繁项目集或者最大频繁项目集。b) 生成关联规则:通过用户给定 Minconfidence ,在频繁项目集中,寻找关联规则。10. 数据挖掘是相关学科充分进展的基础上被提出和进展的。主要的相关技术:数据库等信息技术的进展统计学深化应用人工智能技术的讨论和应用11. 衡量关联规则挖掘结果的有效性:应该从多种综合角度来考虑:a 准确性:挖掘出的规则必须反映数据的实际情况。b 有用性:挖掘出的规则必须是简洁可用的。c 新颖性:挖掘出的关联规则可以为用户提供新的有价值信息。12. 约束的常见类型有:单调性约束;反单调性约束;可转变的约束;简洁性约束.13. 根据规则中涉及到的层次,多层次关联规则可以分为:同层关联规则:假如一个关联规则对应的项目是同一个粒度层次,那么它是同层关联规则。层间关联规则:假如在不同的粒度层次上考虑问题,那么可能得到的是层间关联规14. 根据聚类分析算法的主要思路,聚类方法可以被归纳为如下几种。划分法:基于一定标准构建数据的划分。属 于 该 类 的 聚 类 方 法 有 : k-means 、 k-modes 、 k-prototypes 、 k-medoids、PAM、CLARA、CLARANS 等。层次法:对给定数据对象集合进行层次的分解。密度法:基于数据对象的相连密度评价。网格法:将数据空间划分...