第1页共14页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共14页乳房癌的诊断【摘要】针对本题的实际,综合应用DKLT、最小误判准则、最小风险准则、分支定界次优算法l-r法求解本题
不断结合对已知类别样本的检验结果分析所用方法的不足,然后改进,正确率达到95%以上
其中提出”拒判”的概念以进一步减小判决带来的风险
69个未知类别样本的分类结果见正文表一和表二
为节省费用,只用此30个特征数据中的部分特征来区分乳房肿瘤是良性还是恶性
通过l-r法作的特征选择,选取了细胞核凹陷点数的平均值、断裂度的平均值、质地的标准差、光滑度的标准差、断裂度的最坏值这5个特征就能得到用30个特征分类一样的结果,大大的减少了费用
【关键词】H-K算法离散K-L变换最小误判概率准则最小风险准则l-r法1.问题重述乳房肿瘤通过穿刺采样进行分析可以确定其为良性的或为恶性的
医学研究发现乳房肿瘤病灶组织的细胞核显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切的关系
现试图根据已获得的实验数据建立起一种诊断乳房肿瘤是良性还是恶性的方法
数据来自已经确诊的500个病例,每个病例的一组数据包括采样组织中各细胞核的这10个特征量的平均值,标准差和“最坏值”(各特征的三个最大数据的平均值)共30个数据
并将你的方法用于另外69名已做穿刺采样分析的患者
其中B为良性M为恶性,X为待定
若为节省费用,还想发展一种只用此30个特征数据中的部分特征来区分乳房肿瘤是良性还是恶性的方法,你是否可找到一个特征数少而区分又很好的方法
2.模型假设1.所给数据基本没有误差,各样本病例的诊断结果完全正确
2.30个特征能提供充分的分类信息
3.名词解释与符号说明模式:对分类识别对象进行科学的抽象,建立它的数学模型,用以描述和替代识