用身高和体重数据进行性别分类的实验报告姓 名:刘懿郴学 号:2009302308 范英学 号: 2009302316 胡亮学 号: 2009302319 班级:9391 1、 基本要求用 FAMALE
TXT和 MALE
TXT的数据作为训练样本集, 建立 Bayes分类器, 用测试样本数据对该分类器进行测试
调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识
2、具体做法(1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关, 在正态分布假设下估计概率密度, 建立最小错误率 Bayes分类器,写出得到的决策规则, 将该分类器应用到训练 / 测试样本, 考察训练/ 测试错误情况
比较相关假设和不相关假设下结果的差异
在分类器设计时可以考察采用不同先验概率(如0
1 等)进行实验,考察对决策和错误率的影响
(2) 自行给出一个决策表,采用最小风险的Bayes 决策重复上面的实验
3、实验原理已知样本服从正态分布,(1)所以可以用最大似然估计来估计μ 和Σ 两个参数样本类分为男生和女生两类,利用最大似然估计分别估计出男生样本的,,和女生样本的,,然后将数据带入( 1)公式分别计算两者的类条件概率密度和,然后根据贝叶斯公式计算出两类的后验概率和实验一:对于两类情况,我们可以仅定义一个判别函数:其中1gx =11121iiiP xPPxP xP2gx =22221iiiP xPPxP xP并将决策规则表示为如果gx >0,则决策;gx 0,则决策;gx 0输入数据样本集带入判别函数 g x4、实验结果利用 matlab 我们计算出了 male
txt 和 female
txt 的均值和协方差1173
920065
5020 ,120