电子科技大学研究生试卷(考试时间:至,共2小时)课程名称模式识别教师学时40学分2教学方式课堂教学考核日期年月日成绩考核方式:(学生填写)1、(5分)简述有监督学习和无监督学习的异同。答:(1)有监督学习必须要有训练集和测试样本,而非监督学习没有训练集;(2)有监督学习的目的就是识别事物,识别结果表现在给待识别数据加上了标号,因此训练样本集必须由带标号的样本组成,而非监督学习方法只有要分析的数据集本身,预先没有什么标号。(3)非监督学习方法在寻找数据集中的规律性,这种规律性并不一定要达到分数据集的目的,也就是说不一定要“分类”。2、(15分)计算单词model和amdeol的编辑距离,画出栅格图。解:栅格图为:amdeolmodelamdeolbcaty从栅格图可计算,model和amdeol的编辑距离为3。学号姓名学院⋯⋯⋯⋯⋯⋯⋯⋯密⋯⋯⋯⋯⋯封⋯⋯⋯⋯⋯线⋯⋯⋯⋯⋯以⋯⋯⋯⋯⋯内⋯⋯⋯⋯⋯答⋯⋯⋯⋯⋯题⋯⋯⋯⋯⋯无⋯⋯⋯⋯⋯效⋯⋯⋯⋯⋯⋯⋯⋯3、(15分)已知A类样本为:123[0,1];[2,2];[2,3]aaa,B类样本为:123[3,1];[4,3];[1,5]bbb,计算最小二乘分类面的方程(取值为-1和+1),并写出LMS算法的流程。解:(1)计算最小二乘分类面为0.4,0.26,1.45T。(2)LMS算法流程:步骤1.初始化训练样本、权向量;步骤2.选择一个训练样本,利用下列公式更新权向量:[][1][1]2()kkTkiiywwxxw训练样本数目步骤3.重复所有样本。4、(15分)在目标识别中,有1和2两种目标类型,它们的先验概率分别为0.8和0.2,在一次试验中,获得样本的类概率密度分别为10.2px,20.4px,并且已知110,126,211,220。试对该样本进行分类。(1)基于最小错误率贝叶斯决策;(2)基于最小风险贝叶斯决策。解:(1)利用贝叶斯公式,分别计算出1和2的后验概率:111210.20.80.66670.20.80.40.2iiipxPPxpxP222210.40.20.33330.20.80.40.2iiipxPPxpxP根据贝叶斯决策规则,有12PxPx所以合理的决策是把该样本归类于1。(2)根据(1)的计算结果可知后验概率为120.6667,0.3333PxPx计算条件风险211122122221111.99980.6667iiiiiiRxPxPxRxPxPx由于12RxRx,因此判断该样本为2。5、(15分)试描述监督分类三种准则的原理及典型方法。答:回归分析,利用函数逼近的观点构造判决函数,典型方法包括:LMS、RBF网络等。支持向量机,从几何角度,构造约束最优化模型,寻找最优分类面,典型方法包括:线性支持向量机和非线性支持向量机。神经网络,从仿生学角度构造神经网络结构,通过最优化方法进行网络训练,典型方法包括:感知器模型,BP网络等。6、(20分)已知四个样本具有三个特征,分别为:10.15,0.19,0.79,0.06Tv20.39,0.30,0.73,0.10Tv31.08,0.99,3.05,0.33Tv1)计算其协方差矩阵,并对其进行主分量,并对结果进行分析。2)简述mercer定理及核主分量分析的原理。解:(1)协方差矩阵:0.68960.70422.78750.70420.79182.99202.78752.992011.5589TRFF其中,123,,Fvvv。求协方差矩阵的特征值为10,20.0347,313.0056,两个主分量为2和3对应的特征向量,分别为:10.7098,0.7043,0.0111Tv20.2273,0.2440,0.9427Tv说明三个特征分量中有一个特征和另外两个特征相关,采用主分量分析可以识别该相关向量,达到降低特征空间维度的目的。(2)Mercer定理认为,映射变换后的内积可以写为函数的形式。定义:1(),...,()NlNxx则有:TTRKyua@TKKRyuaau根据mercer定理,,(,)TijijKkyyxx@最后得到:()=<(),>=()(,)kkkiiyxaikxxxu相当于在投影域计算KL变换,并进行PCA。7、(15分)请写出模式识别系统的主要系统组成,阐述各部分的功能及主要方法。答:模式识别系统的主要系统组成如下:识别样本,采集用于采集待识别问题的数据数据预处理,主要消除采集系统差异对识别的影响特征提取与选择,从数据中提取具特征,并进行去相关等处理分类器,进行分类,包括监督分类和非监督分类两种,列举相关方法。