第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共6页第11章贝叶斯网络贝叶斯网络是1986年由Pearl提出的,根据各个变量之间的概率关系,使用图论方法表示变量集合的联合概率分布的图形模型
它提供了一种自然的表示因果信息的方法,用来发现数据间的潜在关系
在这个网络中,用节点表示变量,有向边表示变量间的依赖关系
其特点有:贝叶斯理论给出了信任函数在数学上的计算方法,具有稳固的数学基础,同时刻画了信任度与证据的一致性以及信任度随证据而变化的增量学习特性;在数据挖掘中,贝叶斯网络可以处理不完整和带有噪声的数据集,它用概率测度的权重来描述数据间的相关性,从而解决了数据间的不一致性,甚至是相互独立的问题;用图形的方法描述数据间的相互关系,语义清晰、可理解性强,这有助于利用数据间的因果关系进行预测分析;11
1贝叶斯方法的基本观点贝叶斯分析方法的特点是使用概率去表示所有形式的不确定性
学习或其他形式的推理都是用概率规则来实现的
贝叶斯学习的结果表示为随机变量的概率分布,它可以解释为我们对不同可能性的信任程度
贝叶斯学派的起点是贝叶斯的两项工作:贝叶斯定理和贝叶斯假设
假设随机变量x,θ的联合分布密度是p(x,θ),它们的边际密度分别为p(x),p(θ)
设x是观测向量,θ是末知参数向量,则可通过观测向量来获得末知参数向量的估计
贝叶斯定理为:p(θ|x)=π(θ)×p(x|θ)p(x)=π(θ)×p(x|θ)∫π(θ)×p(x|θ)dθ这里,π(θ)是θ的先验分布
上式可以看出,对末知参数向量θ的估计综合了它的先验信息和样第2页共6页第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共6页本信息
而传统的参数估计方法只从样本数据获取信息,如最大似然估计
Bayesian方法对末知参数向量估计的一般过程为:将