用身高和体重数据进行性别分类的实验报告姓 名:懿郴 学 号:2024302308 英 学 号: 2024302316 胡 亮 学 号: 2024302319 班 级:93911、 基本要求 用 FAMALE.TXT 和 MALE.TXT 的数据作为训练样本集,建立Bayes 分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学容的理解和感性认识。2、具体做法 (1)应用两个特征进行实验:同时采纳身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估量概率密度,建立最小错误率Bayes 分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采纳不同先验概率(如 0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)进行实验,考察对决策和错误率的影响。 (2) 自行给出一个决策表,采纳最小风险的 Bayes 决策重复上面的实验。3、实验原理 已知样本服从正态分布, (1)所以可以用最大似然估量来估量 μ 和 Σ 两个参数样本类分为男生和女生两类,利用最大似然估量分别估量出男生样本的,,和女生样本的,,然后将数据带入(1)公式分别计算两者的类条 件概率密度和,然后根据贝叶斯公式计算出两类的后验概率和实验一:对于两类情况,我们可以仅定义一个判别函数:其中 ==并将决策规则表示为 假如 >0,则决策;<0,则决策。 实验二:我们定义一个决策表如下图状态 决策0620我们定义判别函数并将决策规则表示为 假如 >0,则决策;<0,则决策。损失xx>0? 输入数据样本集带入判别函数 N Y 实验流程图4、实验结果利用 matlab 我们计算出了 male.txt 和 female.txt 的均值和协方差,和,,这样我们可以利用公式和判别函数与决策规则对训练/测试样本集进行分类,结果如下:(1)当体重和身高相关的时候 对于 test1 测试集,总体来说,对样本集的推断正确率随着男性的先验概率的增加(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先 验概率的增加,将男性推断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于 test1 测试集,对样本集的推断正确率随着男性的先验概率的增加(女性先验概率的减少)而不断增加,而对于男性或者女性的的个...