第9 章 聚类分析 9
1 聚 类 概 述 9
1 聚 类 简 介 9
2 聚 类 的 定 义 9
3 聚 类 的 要 求 1
可伸缩性 2
处理不同类型属性的能力 3
发现任意形状的聚类 4
使输入参数的领域知识最小化 5
处理噪声数据的能力 6
对于输入记录的顺序不敏感 9
2 聚 类 分 析 中的 相异度计算 9
1 聚 类 算法中的 数据结构 1
数据矩阵(或对象与变量结构) 2
相异度矩阵(或对象-对象结构) 9
2 区间标度变量及其相异度计算 1
区间标度变量 2
相异度计算 数据仓库与数据挖掘技术 9
3 二元变量及其相异度计算 1
二元变量 2
相异度计算 9
4 标称型变量及其相异度计算 1
标称型变量 2
相异度计算 9
5 序数型变量及其相异度计算 1
序数型变量 2
相异度计算 9
6 比例标度型变量及其相异度计算 1
比例标度型变量 2
相异度计算 数据仓库与数据挖掘技术 9
7 混 合 类 型 变 量 的 相 异 度 计 算 9
3 基 于 划 分 的 聚 类 方 法 9
1k-平 均 算 法 9
2k-中心点算 法 9
4 基 于 层次的 聚 类 方 法 1
凝聚的方法 2
分裂的方法 图9-1 在数据集{a,b,c,d,e}上的凝聚和分裂层次聚类 数据仓库与数据挖掘技术 9
5 谱 聚 类 方 法 9
1 谱 聚 类 的 步 骤 9
2 谱 聚 类 的 优点 9
3 谱 聚 类 实例 9
6 利用 SQL Serv er 2005 进行聚 类 分析 9
1 挖掘流程 图 9-2 选择数据挖掘技术 数据仓库与数据挖掘技术 图 9 -3 选择数据源视图