1 用身高和/或体重数据进行性别分类 1、【实验目的】 (1)掌握最小错误率Bayes 分类器的决策规则 (2)掌握Parzen 窗法 (3)掌握Fisher 线性判别方法 (4)熟练运用matlab 的相关知识
2、【实验原理】 (1)、最小错误率Bayes 分类器的决策规则 如果在特征空间中观察到某一个(随机)向量x = ( x1 , x2 ,…, xd )T,已知类别状态的先验概率为: ()iP w和类别的条件概率密度为( | )1,2,3
iP x wic,根据Bayes 公式得到状态的后验概率 有:1( |) ()(| )( |) ()iiicjjjpPPpP xxx 基本决策规则:如果1,
,(| )max(| )ijjcPPxx ,则ix,将 x 归属后验概率最大的类别
(2)、掌握Parzen 窗法 对于被估计点 X: 其估计概率密度的基本公式(x)NkNNNpV,设区域 RN 是以 hN 为棱长的 d 维超立方体,则立方体的体积为dNNVh; 选择一个窗函数(u),落入该立方体的样本数为x x1()iNNNhik,点 x 的概率密度: xx111(x)()NiNNkNNNVhiNpVN 其中核函数:x x1iK(x,x )()iNNVh,满足的条件:i(1) K(x,x )0;i(2) K(x,x )dx1
(3)、Fisher 线性判别方法 Fisher 线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将2 高维问题降低到一维问题来解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能地远
Fisher 线性判别分析,就是通过给定的训练数据,确定投影方向W 和阈值y0,即确定线性判别函数,然后根据这个线性判别函数,