IRIS 数据集的Bayes 分类实验 一、 实验原理 1) 概述 模式识别中的分类问题是根据对象特征的观察值将对象分到某个类别中去
统计决策理论是处理模式分类问题的基本理论之一,它对模式分析和分类器的设计有着实际的指导意义
贝叶斯(Bayes)决策理论方法是统计模式识别的一个基本方法,用这个方法进行分类时需要具备以下条件: ➢ 各类别总体的分布情况是已知的
➢ 要决策分类的类别数是一定的
其基本思想是:以 Bayes 公式为基础,利用测量到的对象特征配合必要的先验信息,求出各种可能决策情况(分类情况)的后验概率,选取后验概率最大的,或者决策风险最小的决策方式(分类方式)作为决策(分类)的结果
也就是说选取最有可能使得对象具有现在所测得特性的那种假设,作为判别的结果
常用的Bayes 判别决策准则有最大后验概率准则(MAP),极大似然比准则(ML),最小风险 Bayes 准则,Neyman-Pearson 准则(N-P)等
2) 分类器的设计 对于一个一般的c 类分类问题,其分类空间: cwww,,,21 表特性的向量为: Tdxxxx,,,21 其判别函数有以下几种等价形式: a) ijiwwijcjwwxwPxwP,且,,,2,11, b) ijjiwwijcjwPwxpwPwxp,且,,,2,1i c) iijjiwwijcjwPwPwxpwxpxl,且,,,2,1 d) ijjiiwwijcjwPwxnpwPwxp,且,,,2,1lnlnln 3) IRIS 数据分类实验的设计 ➢ IRIS 数据集: 一共具有三组数据,每一组都是一个单独的类别,每组有50 个数据,每个数据都是一个四维向