Parzen窗估计与KN近邻估计试验报告材料VIP免费

下载本文档

阅读 171
下载 14
格式 pdf
大小 1.11 MB
约12页
2024-11-11 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/12页

2/12页

3/12页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/12

文本预览下载提示常见问题

实用文案标准文档模式识别实验报告题目：Parzen窗估计与KN近邻估计学院计算机科学与技术专业xxxxxxxxxxxxxxxx学号xxxxxxxxxxxx姓名xxxx指导教师xxxx20xx年xx月xx日Parzen窗估计与KN近邻估计一、实验目的装订线实用文案标准文档本实验的目的是学习Parzen窗估计和k最近邻估计方法。在之前的模式识别研究中，我们假设概率密度函数的参数形式已知，即判别函数J(.)的参数是已知的。本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式。在模式识别中有躲在令人感兴趣的非参数化方法，Parzen窗估计和k最近邻估计就是两种经典的估计法。二、实验原理1.非参数化概率密度的估计对于未知概率密度函数的估计方法，其核心思想是：一个向量x落在区域R中的概率可表示为：其中，P是概率密度函数p(x)的平滑版本，因此可以通过计算P来估计概率密度函数p(x)，假设n个样本x1,x2,⋯,xn，是根据概率密度函数p(x)独立同分布的抽取得到，这样，有k个样本落在区域R中的概率服从以下分布：其中k的期望值为：k的分布在均值附近有着非常显著的波峰，因此若样本个数n足够大时，使用k/n作为概率P的一个估计将非常准确。假设p(x)是连续的，且区域R足够小，则有：如下图所示，以上公式产生一个特定值的相对概率，当n趋近于无穷大时，曲线的形状逼近一个δ函数，该函数即是真实的概率。公式中的V是区域R所包含的体积。综上所述，可以得到关于概率密度函数p(x)的估计为：实用文案标准文档在实际中，为了估计x处的概率密度函数，需要构造包含点x的区域R1,R2,⋯,Rn。第一个区域使用1个样本，第二个区域使用2个样本，以此类推。记Vn为Rn的体积。kn为落在区间Rn中的样本个数，而pn(x)表示为对p(x)的第n次估计：欲满足pn(x)收敛：pn(x)→p(x)，需要满足以下三个条件：有两种经常采用的获得这种区域序列的途径，如下图所示。其中“Parzen窗方法”就是根据某一个确定的体积函数，比如Vn=1/√n来逐渐收缩一个给定的初始区间。这就要求随机变量kn和kn/n能够保证pn(x)能收敛到p(x)。第二种“k-近邻法”则是先确定kn为n的某个函数，如kn=√n。这样，体积需要逐渐生长，直到最后能包含进x的kn个相邻点。实用文案标准文档2.Parzen窗估计法已知测试样本数据x1,x2,⋯,xn，在不利用有关数据分布的先验知识，对数据分布不附加任何假定的前提下，假设R是以x为中心的超立方体，h为这个超立方体的边长，对于二维情况，方形中有面积V=h^2，在三维情况中立方体体积V=h^3，如下图所示。根据以下公式，表示x是否落入超立方体区域中：估计它的概率分布：实用文案标准文档其中n为样本数量，h为选择的窗的长度，φ(.)为核函数，通常采用矩形窗和高斯窗。3.k最近邻估计在Parzen算法中，窗函数的选择往往是个需要权衡的问题，k-最近邻算法提供了一种解决方法，是一种非常经典的非参数估计法。基本思路是：已知训练样本数据x1,x2,⋯,xn而估计p(x)，以点x为中心，不断扩大体积Vn，直到区域内包含k个样本点为止，其中k是关于n的某一个特定函数，这些样本被称为点x的k个最近邻点。当涉及到邻点时，通常需要计算观测点间的距离或其他的相似性度量，这些度量能够根据自变量得出。这里我们选用最常见的距离度量方法：欧几里德距离。最简单的情况是当k=1的情况，这时我们发现观测点就是最近的（最近邻）。一个显著的事实是：这是简单的、直观的、有力的分类方法，尤其当我们的训练集中观测点的数目n很大的时候。可以证明，k最近邻估计的误分概率不高于当知道每个类的精确概率密度函数时误分概率的两倍。三、实验基本步骤第一部分，对表格中的数据，进行Parzen窗估计和设计分类器，本实验的窗函数为一个球形的高斯函数，如下：实用文案标准文档1)编写程序，使用Parzen窗估计方法对一个任意的测试样本点x进行分类。对分类器的训练则使用表格3中的三维数据。同时，令h=1，分类样本点为(0.5,1.0,0.0)，(0.31,1.51,-0.50)，(-0.3,0.44,-0.1)进行实验。2)可以改变h的值，不同的h将导致不同的概率密度曲线，如下图所示。h=0.1时：h=0.5时：实用文案标准文档h=1时：第二部分的实验目的是学习和掌握非参数估计：k-近邻概率密度估计方法...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

Parzen窗估计与KN近邻估计试验报告材料

在之前的模式识别研究中，我们假设概率密度函数的参数形式已知，即判别函数J(

)的参数是已知的

本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式

在模式识别中有躲在令人感兴趣的非参数化方法，Parzen窗估计和k最近邻估计就是两种经典的估计法

二、实验原理1

非参数化概率密度的估计对于未知概率密度函数的估计方法，其核心思想是：一个向量x落在区域R中的概率可表示为：其中，P是概率密度函数p(x)的平滑版本，因此可以通过计算P来估计概率密度函数p(x)，假设n个样本x1,x2,⋯,xn，是根据概率密度函数p(x)独立同分布的抽取得到，这样，有k个样本落在区域R中的概率服从以下分布：其中k的期望值为：k的分布在均值附近有着非常显著的波峰，因此若样本个数n足够大时，使用k/n作为概率P的一个估计将非常准确

假设p(x)是连续的，且区域R足够小，则有：如下图所示，以上公式产生一个特定值的相对概率，当n趋近于无穷大时，曲线的形状逼近一个δ函数，该函数即是真实的概率

公式中的V是区域R所包含的体积

综上所述，可以得到关于概率密度函数p(x)的估计为：实用文案标准文档在实际中，为了估计x处的概率密度函数，需要构造包含点x的区域R1,R2,⋯,Rn

第一个区域使用1个样本，第二个区域使用2个样本，以此类推

记Vn为Rn的体积

kn为落在区间Rn中的样本个数，而pn(x)表示为对p(x)的第n次估计：欲满足pn(x)收敛：pn(x)→p(x)，需

文库当当响 + 关注: 实名认证
内容提供者

该用户很懒，什么也没介绍

收藏店铺进入空间

Parzen窗估计与KN近邻估计试验报告材料VIP免费

Parzen窗估计与KN近邻估计试验报告材料

您可能关注的文档

相关文档

热门下载

相关标签