人脸检测与人脸识别Car情报局知识回顾知识回顾重点:•机器学习、无监督学习、聚类•DBSCAN•KMeans难点:•聚类方法的理解与参数选择作业:实验报告Car情报局知识回顾:无监督学习知识回顾:无监督学习无监督学习常常被用于数据挖掘,用于在大量无标签数据中发现些什么
它的训练数据是无标签的,训练目标是能对观察值进行分类或者区分等
无监督主要有三种:•聚类•离散点检测•降维Car情报局知识回顾:聚类知识回顾:聚类•聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程“物以类聚,人以群分”•核心:提取特征•主要方法:划分方法(partitioningmethods):K-MEANS算法、K-MEDOIDS算法、CLARANS算法层次方法(hierarchicalmethods)::BIRCH算法、CURE算法、CHAMELEON算法基于密度的方法(density-basedmethods)::DBSCAN算法、OPTICS算法、DENCLUE算法基于网格的方法(grid-basedmethods):STING算法、CLIQUE算法、WAVE-CLUSTER算法基于模型的方法(model-basedmethods):统计的方案和神经网络的方案Car情报局知识回顾:使用知识回顾:使用BDSCANBDSCAN聚类确定质心个数聚类确定质心个数fromsklearn
clusterimportDBSCANy_pred=DBSCAN()
fit_predict(data)plt
scatter(data[0],data[1],c=y_pred)EpsMinPts=5边界点:若其领域内点不超过MinPts个核心点:若其领域内点超过MinPts个Car情报局知识回顾:使用知识回顾:使用K-MeansK-Means对观影用户进行聚类对观影用户进行聚类#训练num_clust