模式识别与智能信息处理实践 实验一 聚类分析 一、实验目的 通过聚类分析实验,加深对聚类分析基本思想、方法的理解和掌握。 二、实验内容 了解动态、静态聚类算法的特点; 熟练掌握 k-均值算法或层次聚类算法; 编写能对实际模式样本正确分类的算法程序。 掌握动态聚类算法的基本思想; 认识类别数、初始类心的选择对 k-均值算法聚类结果的影响; 编写能对实际模式样本正确分类的 k-均值算法程序。 三、方法手段 设类别数为 k,选取 k 个初始聚类中心,按最小距离原则将各模式分配到 k 类中的某一类,不断地计算类心和调整各模式的类别使每个模式特征矢量到其所属类别中心的距离平方之和最小 。 四、k-均值算法 (1)从 D 中随机取 k 个元素,作为 k 个簇的各自的中心。 (2)分别计算剩下的元素到 k 个簇中心的相异度,将这些元素分别划归到相异度最低的簇。 (3)根据聚类结果,重新计算 k 个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。 (4)将 D 中全部元素按照新的中心重新聚类。 (5)重复第4 步,直到聚类结果不再变化。 五、k-均值程序运行结果 (1)改变初始类心,观察对聚类结果的影响 若选初始类心是[1 2 3]时的结果为其分为 1 类共39 个,分为 2 类共61 个,分为 3 类共50 个,其中被 分为第1 类的样本为{51 53 78 101 103 104 105 106 108 109 110 111 112 113 116 117 118 119 121 123 125 126 129 130 131 132 133 135 136 137 138 140 141 142 144 145 146 148 149} 被 分为第2 类的样本为{52 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 102 107 114 115 120 122 124 127 128 134 139 143 147 150} 被 分为第3 类的样本为{1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50}。 若选初始类心是[2 4 5]时其聚类结果为其分为1 类共96 个,分为2 类共22 个,分为3类共个32,其中被分为第1 类的样本为{51 52 53 54 55 56 57 59 60 62 63 64 65 66 67 68 69 ...