实用文案标准文档模式识别实验报告题目:Parzen窗估计与KN近邻估计学院计算机科学与技术专业xxxxxxxxxxxxxxxx学号xxxxxxxxxxxx姓名xxxx指导教师xxxx20xx年xx月xx日Parzen窗估计与KN近邻估计一、实验目的装订线实用文案标准文档本实验的目的是学习Parzen窗估计和k最近邻估计方法
在之前的模式识别研究中,我们假设概率密度函数的参数形式已知,即判别函数J(
)的参数是已知的
本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式
在模式识别中有躲在令人感兴趣的非参数化方法,Parzen窗估计和k最近邻估计就是两种经典的估计法
二、实验原理1
非参数化概率密度的估计对于未知概率密度函数的估计方法,其核心思想是:一个向量x落在区域R中的概率可表示为:其中,P是概率密度函数p(x)的平滑版本,因此可以通过计算P来估计概率密度函数p(x),假设n个样本x1,x2,⋯,xn,是根据概率密度函数p(x)独立同分布的抽取得到,这样,有k个样本落在区域R中的概率服从以下分布:其中k的期望值为:k的分布在均值附近有着非常显著的波峰,因此若样本个数n足够大时,使用k/n作为概率P的一个估计将非常准确
假设p(x)是连续的,且区域R足够小,则有:如下图所示,以上公式产生一个特定值的相对概率,当n趋近于无穷大时,曲线的形状逼近一个δ函数,该函数即是真实的概率
公式中的V是区域R所包含的体积
综上所述,可以得到关于概率密度函数p(x)的估计为:实用文案标准文档在实际中,为了估计x处的概率密度函数,需要构造包含点x的区域R1,R2,⋯,Rn
第一个区域使用1个样本,第二个区域使用2个样本,以此类推
记Vn为Rn的体积
kn为落在区间Rn中的样本个数,而pn(x)表示为对p(x)的第n次估计:欲满足pn(x)收敛:pn(x)→p(x),需