数学建模案例分析 模型1 蠓虫分类 问题背景 两种蠓虫Af 和Apf 已由生物学家W.L.Grogon 和W.W.Wirth(1981)根据它们的触角长度、翅膀长度加以区分. 现测得6 只Apf 和9只Af 的触长、翅膀长的数据如下: Apf 1.14,1.78 1.18,1.96 1.20,1.86 1.26,2.00 1.28,2.00 1.30,1.96 Af 1.24,1.72 1.36,1.74 1.38,1.64 1.38,1.82 1.38,1.90 1.40,1.70 1.49,1.82 1.54,1.82 1.56,2.08 问题 ⑴如何根据以上数据,制定一种方法正确区分两种蠓虫? ⑵将你的方法用于触长、翅长分别为 1.24,1.80 , 1.28,1.84 , 1.40,2.04的3个样本进行识别. 如何考虑? 该问题属于统计模型范畴!(属于黑洞问题) 1 .首先对已有数据进行分析.(测试) 画出相应的散点图 什么启发? 从图中可以看出,两类蠓虫有明显的差别.问题是该如何识别. 法1 用最小二乘法得到回归线: 结果不理想. 法2 用斜率的平均值构造直线 结果? 图中不同类别的蠓虫的区别还是比较明显的. 如何做进一步的识别? 用此方法对给定的三个蠓虫进行识别,若点在直线的上方,则判定为 Apf,否则定为Af. 由此建立识别函数 dist.m. 对给定的样本进行识别,如果样本点在直线上方,则将该蠓虫识别为 Apf(标示为 1),否则识别为 Af(标示为 0). 程序如下: clear,clc Apf1=[1.14,1.18,1.20 1.26 1.28 1.30]; Apf2=[1.78 1.96 1.86 2.00 2.00 1.96]; Af1=[1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56]; Af2=[1.72 1.74 1.64 1.82 1.90 1.70 1.82 1.82 2.08]; x=[Apf1,Af1];y=[Apf2,Af2]; n=length(x); k=sum(y./x)/n; A=[1.24,1.80;1.28,1.84;1.40,2.04]; n=size(A,1);p=[]; for i=1:n d=A(i,2)-k*A(i,1); if d>0 p=[p,1]; else p=[p,0]; end end disp(p) 结果为 1 1 1 即:三个新样本的判定结果均为Ap f! 这样的判定是否有效?(模型解释) 为解释判别法的有效性,引入交叉误判率. 交叉误判率 交叉误判率是每次剔除一个样品,利用其余的训练样本建立判别准则,根据建立的判别准则对删除的样品进行判定,以其误判的比例作为误判率. 具体过程如下: ①从总体为1G 的训练样本开始,剔除其中每一个样品,剩余的1m 个样品与2G 中的全部样品建立判别函数; ②用建立的判别函数对剔除的样品进行判别; ③重...