用身高和体重数据进行性别分类的实验报告姓 名:刘懿郴学 号:2009302308 范英学 号: 2009302316 胡亮学 号: 2009302319 班级:9391 1、 基本要求用 FAMALE.TXT和 MALE.TXT的数据作为训练样本集, 建立 Bayes分类器, 用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。2、具体做法(1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关, 在正态分布假设下估计概率密度, 建立最小错误率 Bayes分类器,写出得到的决策规则, 将该分类器应用到训练 / 测试样本, 考察训练/ 测试错误情况。 比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)进行实验,考察对决策和错误率的影响。(2) 自行给出一个决策表,采用最小风险的Bayes 决策重复上面的实验。3、实验原理已知样本服从正态分布,(1)所以可以用最大似然估计来估计μ 和Σ 两个参数样本类分为男生和女生两类,利用最大似然估计分别估计出男生样本的,,和女生样本的,,然后将数据带入( 1)公式分别计算两者的类条件概率密度和,然后根据贝叶斯公式计算出两类的后验概率和实验一:对于两类情况,我们可以仅定义一个判别函数:其中1gx =11121iiiP xPPxP xP2gx =22221iiiP xPPxP xP并将决策规则表示为如果gx >0,则决策;gx <0,则决策。实验二:我们定义一个决策表如下图状态决策0 6 2 0 我们定义判别函数并将决策规则表示为如果gx >0,则决策;gx <0,则决策。N Y 实验流程图损失xxgx>0输入数据样本集带入判别函数 g x4、实验结果利用 matlab 我们计算出了 male.txt 和 female.txt 的均值和协方差1173.920065.5020 ,120.753623.058223.058259.8982 和2162.840052.5960 ,243.9344 15.525415.525431.1285 ,这样我们可以利用公式和判别函数与决策规则对训练/测试样本集进行分类,结果如下:(1)当体重和身高相关的时候男性pw1女性pw2男性判断正确男性判断错误女性判断正确女性判断错误正确率错误率 男性判断正确男性判断错误女性判断正确女性判断错误正确率 错0.10.913715080%20%15397491 67.30%30.40.6191150 ##### 2.90%21139491 86.70%10.50.5191150 ##### 2.90%21931491 89.30%10.60.4200141 ...