简答题 1。 什么是模式与模式识别 模式识别: 模式识别是研究用计算机来实现人类模式识别能力的一门学科。 模式:模式是一些供模仿用的、完美无缺的标本。 2. 模式识别系统的组成 信息获取,预处理,特征提取和选取,分类器设计,分类决策 3。 什么是后验概率? 系统在某个具体的模式样本X 条件下位于某种类型的概率。、 4. 确定线性分类器的主要步骤 采集训练样本,构成训练样本集。样本应该具有典型性 确定一个准则J=J(w,x),能反映分类器性能,且存在权值w*使得分类器性能最优 设计求解w 的最优算法,得到解向量w* 5. 样本集推断总体概率分布的方法? 参数估计 监督参数估计:样本所属类别及类条件总体概率密度函数的形式已知,某些参数未知 非监督参数估计:已知总体概率密度函数形式但未知样本类别,要推断某些参数 非参数估计:已知样本类别,未知总体概率密度函数形式,要求直接推断概率密度函数本身 6. 近邻法的主要思想 作为一种分段线性判别函数的极端情况,将各类中全部样本都作为代表点,这样的决策方法就是近邻法的基本思想。 7. 什么是K 近邻法? 他是最近邻法的推广,取未知样本x 的k 个近邻,看这k 个近邻中多数属于哪一类,就把x 归为哪一类. 8. 监督学习和非监督学习的区别 监督学习的用途明确,就是对样本进行分类.训练样本集给出不同类别的实例,从这些实例中找出区分不同类样本的方法,划定决策面 非监督学习的用途更广泛,用来分析数据的内在规律,如聚类分析,主分量分析,数据拟合等等 9. 什么是误差平法和准则 对于一个给定的聚类,均值向量是最能代表聚类中所有样本的一个向量,也称其为聚类中心.一个好的聚类方法应能使集合中的所有向量与这个均值向量的误差的长度平方和最小. 10。 分级聚类算法有两种基本思路 聚合法:把所有样本各自看为一类,逐级聚合成一类。基本思路是根据类间相似性大小逐级聚合,每级只把相似性最大的两类聚合成一类,最终把所有样本聚合为一类。 分解法:把所有样本看做一类,逐级分解为每个样本一类。 11。 特征抽取和选择的区别 在一定意义上特征抽取和特征选择都是要达到特征降维的目的,只是所实现的途径不同。特征抽取是通过变换的方法组合原始高维特征,获得一组低维的新特征,而特征选择是根据专家的经验知识或根据某种评价准则来挑选出那些对分类最有影响力的特征,并未形成新的特征。 12. 最优搜索算法 最优搜索算法:至今能得到最优解...