贝叶斯分类器VIP免费

下载本文档

阅读 147
下载 22
格式 ppt
大小 848.52 KB
约40页
2024-10-23 发布于江苏
收藏
评论
点赞(0)
海报
举报

1/40页

2/40页

3/40页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/40

文本预览下载提示常见问题

贝叶斯分类器贝叶斯定理每个记录用一个d维特征向量X=(x1,x2,…,xd)表示假定有k个类y1,y2,…,yk.给定X,X属于yj类的后验概率P(yj|X)满足贝叶斯(Bayes)定理MAP(maximumposteriorihypothesis,最大后验假设)将X指派到具有最大后验概率P(yj|X)的类yj，即将X指派到P(X|yj)P(yj)最大的类yj)()()|()|(XPjyPjyXPXjyP2朴素贝叶斯分类3朴素贝叶斯分类(NaïveBayesClassifier)工作原理给定一个未知的数据样本X,分类法将预测X属于具有最高后验概率的类.即,未知的样本分配给类yj,当且仅当根据贝叶斯定理,我们有由于P(X)对于所有类为常数,只需要最大化P(X|yj)P(yj)即可.jikiyPyPij,1),|()|(XX)()()|()|(XXXPyPyPyPjjj朴素贝叶斯分类(续)4估计P(yj)类yj的先验概率可以用P(yj)=nj/n估计其中,nj是类yj中的训练样本数,而n是训练样本总数估计P(X|yj)为便于估计P(X|yj),假定类条件独立----给定样本的类标号,假定属性值条件地相互独立.于是,P(X|Y=yj)可以用下式估计其中,P(x|yj)可以由训练样本估值dijijyxPyP1)|()|(X朴素贝叶斯分类(续)5估计P(xi|yj)设第i个属性Ai是分类属性,则P(xi|yj)=nij/nj其中nij是在属性Ai上具有值xi的yj类的训练样本数,而nj是yj类的训练样本数设第i个属性Ai是连续值属性把Ai离散化假定Ai服从高斯分布其中,ij,ij分别为给定yj类的训练样本在属性Ai上的均值和标准差222)(21)|(ijijixijjieyxP朴素贝叶斯分类器所需要的信息•计算每个类的先验概率P(yj):P(yj)=nj/n其中,nj是yi类的训练样本数,而n是训练样本总数•对于离散属性Ai，设的不同值为ai1,ai2,…,ail，•对于每个类yj，计算后验概率P(aik|yj),1klP(aik|yj)=nikj/nj其中nikj是在属性Ai上具有值aik的yj类的训练样本数,而nj是yj类的训练样本数•对于连续属性Ai和每个类yj，计算yj类样本的均值ij,标准差ij朴素贝叶斯分类6贝叶斯分类器:例例:Tid有房婚姻状况年收入拖欠贷款12345678910是否否是否否是否否否单身已婚单身已婚离婚已婚离婚单身已婚单身125K100K70K120K95K60K220K85K75K90KNoNoNoNoYesNoNoYesNoYes7P(Yes)=3/10P(No)=7/10P(有房=是|No)=3/7P(有房=否|No)=4/7P(有房=是|Yes)=0P(有房=否|Yes)=1P(婚姻状况=单身|No)=2/7P(婚姻状况=离婚|No)=1/7P(婚姻状况=已婚|No)=4/7P(婚姻状况=单身|Yes)=2/3P(婚姻状况=离婚|Yes)=1/3P(婚姻状况=已婚|Yes)=0年收入：类=No：样本均值=110样本方差=2975类=Yes：样本均值=90样本方差=25HowtoEstimateProbabilitiesfromData?•Normaldistribution:•Oneforeach(Ai,ci)pair•For(年收入,Class=No):•IfClass=No•样本均值=110•样本方差=2975222)(221)|(ijijiAijjiecAP2(120110)2(2975)1(120|)0.00722(54.54)PNoe年收入Tid有房婚姻状况年收入拖欠贷款12345678910是否否是否否是否否否单身已婚单身已婚离婚已婚离婚单身已婚单身125K100K70K120K95K60K220K85K75K90KNoNoNoNoYesNoNoYesNoYesX=（有房=否，婚姻状况=已婚，年收入=$120K）•计算P(X|No)和P(X|Yes)P(X|No)=P(有房=否|No)P(婚姻状况=已婚|No)P(年收入=$120K|No)=4/74/70.0072=0.0024P(X|Yes)=P(有房=否|Yes)P(婚姻状况=已婚|Yes)P(年收入=$120K|Yes)=101.2109=0•计算P(X|No)P(No)和P(X|Yes)P(Yes)P(X|No)P(No)=0.00240.7=0.00168P(X|Yes)P(Yes)=00.3=0•因为P(X|No)P(No)>P(X|Yes)P(Yes),所以X分类为No贝叶斯分类器:例(续)9贝叶斯分类器10问题•如果诸条件概率P(Xi=xi|Y=yj)中的一个为0，则它们的乘积（计算P(X|Y=yj)的表达式）为0•很可能每个P(X|Y=yj)都为0解决方法•使用m估计、Laplace估计:原估计:P(Xi=xi|Y=yj)=nij/njknnyYxXPjijiii1)|(:Laplacem-estimate:(|)cijnmpPxynmExampleofNaïveBayesClassifierNameGiveBirthCanFlyLiveinWaterHaveLegsClasshumanyesnonoyesmammalspythonnononononon-mammalssalmonnonoyesnonon-mammalswhaleyesnoyesnomammalsfrognonosometimesyesnon-mammalskomodonononoyesnon-mammalsbatyesyesnoyesmammalspigeonnoyesnoy...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

贝叶斯分类器

您可能关注的文档

读万卷书 + 关注: 实名认证
内容提供者

各类经典PPT文档分享

收藏店铺进入空间

贝叶斯分类器VIP免费

贝叶斯分类器

您可能关注的文档

相关文档

热门下载

相关标签