贝叶斯推断及其互联网应用(一)作者:阮一峰日期:2011年8月25日一年前的这个时候,我正在翻译PaulGraham的《黑客与画家》
那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)
说实话,我没完全看懂那一章
那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了
我只好硬着头皮,按照字面意思把它译了出来
虽然交稿了,译文质量也还可以,但是心里很不舒服,下决心一定要搞懂它
一年过去了,我读了一些概率论文献,逐渐发现贝叶斯推断并没有想象的那么难
相反的,它的原理部分实际上很容易理解,甚至不需要用到高等数学
下面就是我的学习笔记
需要声明的是,我并不是这方面的专家,数学其实是我的弱项
所以,欢迎大家提出宝贵意见,让我们共同学习和提高
=====================================贝叶斯推断及其互联网应用作者:阮一峰一、什么是贝叶斯推断贝叶斯推断(Bayesianinference)是一种统计学方法,用来估计统计量的某种性质
它是贝叶斯定理(Bayes'theorem)的应用
英国数学家托马斯·贝叶斯(ThomasBayes)在1763年发表的一篇论文中,首先提出了这个定理
贝叶斯推断与其他统计学推断方法截然不同
它建立在主观判断的基础上,也就是说,你可以不需要客观证据,先估计一个值,然后根据推断结果不断修正
正是因为它的主观性太强,曾经遭到许多统计学家的诟病
贝叶斯推断需要大量的计算,因此历史上很长一段时间,无法得到广泛应用
只有等到计算机诞生以后,它才获得真正的重视
人们发现,许多统计量是无法事先进行客观判断的,而互联网时代出现的大型数据集,再加上高速运算能力,为验证这些统计量提供了方便,也为应用贝叶斯推断创造了条件,它的威力正在日益显现
二、贝叶斯定理要理解贝叶斯推