第1页共9页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共9页用身高和体重数据进行性别分类的实验报告姓名:刘懿郴学号:2009302308范英学号:2009302316胡亮学号:2009302319班级:93911、基本要求用FAMALE
TXT和MALE
TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试
调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识
2、具体做法(1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况
比较相关假设和不相关假设下结果的差异
在分类器设计时可以考察采用不同先验概率(如0
1等)进行实验,考察对决策和错误率的影响
第2页共9页第1页共9页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共9页(2)自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验
3、实验原理已知样本服从正态分布,(1)所以可以用最大似然估计来估计μ和Σ两个参数样本类分为男生和女生两类,利用最大似然估计分别估计出男生样本的,,和女生样本的,,然后将数据带入(1)公式分别计算两者的类条件概率密度和,然后根据贝叶斯公式计算出两类的后验概率和实验一:对于两类情况,我们可以仅定义一个判别函数:其中==并将决策规则表示为如果>0,则决策;0,则决策;