第五章贝叶斯统计1、贝叶斯统计学回顾定理1:贝叶斯定理的形式如下:它让我们能够通过后验概率,在观测到D之后估计w的不确定性
贝叶斯定理右侧的量由观测数据集D来估计,可以被看成参数向量w的函数,被称为似然函数(likelihoodfunction)
它表达了在不同的参数向量w下,观测数据出现的可能性的大小
在观察到数据之前,我们对参数的一些假设,通过先验分布体现
给定似然函数的定义,贝叶斯定理按照自然语言如下:2、几个问题的引入观察贝叶斯定理,在将贝叶斯方法用到统计问题以及更进一步的机器学习问题中,很直观的我们有以下问题需要考虑:(1)似然函数的选择;(2)先验分布的选择;(3)在确定似然函数和先验分布之后,得到后验分布,如何根据后验分布做出统计推断以及决策;(4)如何评价我们的前三步的选择
之后我们将逐步解决以上四个问题
3、似然函数的选择前面的章节中,已经介绍过过拟合和欠拟合的概念:复杂的模型会导致过拟合,而简单的模型又会有欠拟合的忧虑
在贝叶斯方法中同样如此,似然函数包含着我们对数据D所了解的全部信息,合理的选择似然函数的形式,将直接影响模型的好坏,将这个问题称作贝叶斯模型选择
假设我们想比较L个模型,其中i=1,
给定一训数据集D,由贝叶斯定理,我们有模型的后验分布:先验分布让我们能够表达不同模型之间的优先级,假设我们对任意一个模型都没有偏爱,我们发现关于模型分布正比于模型的似然函数,因此最大化后验分布等价于最大化似然函数
由此,我们引入模型证据的概念,或者称作边缘似然函数
下面给出相应定义:定义2:(模型证据的定义)使用模型证据的概念,我们就可以进行贝叶斯模型选择,其中的合理性,有以下的近似结论:最大化模型证据的结果将使得我们选择一个复杂度适中的模型
关于这点将给出近似的证明,为便于理解,我们使用到如下两图:证明:在w为m维的情况下,上式可写作:取对数可得