1 用身高和/或体重数据进行性别分类 1、【实验目的】 (1)掌握最小错误率Bayes 分类器的决策规则 (2)掌握Parzen 窗法 (3)掌握Fisher 线性判别方法 (4)熟练运用matlab 的相关知识。 2、【实验原理】 (1)、最小错误率Bayes 分类器的决策规则 如果在特征空间中观察到某一个(随机)向量x = ( x1 , x2 ,…, xd )T,已知类别状态的先验概率为: ()iP w和类别的条件概率密度为( | )1,2,3...iP x wic,根据Bayes 公式得到状态的后验概率 有:1( |) ()(| )( |) ()iiicjjjpPPpP xxx 基本决策规则:如果1,...,(| )max(| )ijjcPPxx ,则ix,将 x 归属后验概率最大的类别 。 (2)、掌握Parzen 窗法 对于被估计点 X: 其估计概率密度的基本公式(x)NkNNNpV,设区域 RN 是以 hN 为棱长的 d 维超立方体,则立方体的体积为dNNVh; 选择一个窗函数(u),落入该立方体的样本数为x x1()iNNNhik,点 x 的概率密度: xx111(x)()NiNNkNNNVhiNpVN 其中核函数:x x1iK(x,x )()iNNVh,满足的条件:i(1) K(x,x )0;i(2) K(x,x )dx1。 (3)、Fisher 线性判别方法 Fisher 线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将2 高维问题降低到一维问题来解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能地远。 Fisher 线性判别分析,就是通过给定的训练数据,确定投影方向W 和阈值y0,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。 线性判别函数的一般形式可表示成 0)(wXWXgT ,其中dxxX1 dwwwW21 根据Fisher 选择投影方向W 的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W 的函数为: 2221221~~)~~()(SSmmWJF )(211*mmSWW 上面的公式是使用Fisher 准则求最佳法线向量的解,该式比较重要。另外,该式这种形式的运算,我们称为线性变换,其中21mm 式一个向量,1WS是WS的逆矩阵,如21mm 是d 维,WS和1WS都是d×d 维,得到的*W 也是一个d 维的向量。 向量*W 就是使Fisher 准则函数)(WJF达极大值的解,也就是按 Fisher 准则...