贝叶斯网络预测信用卡欺诈行为一、理论说明1.贝叶斯网络的应用使用贝叶斯网络,可以通过将观察到并记录下的数据与实际常识结合起来构建概率模型,以通过使用表面看上去不相关的属性确定发生的可能性,找出一个结果到底与哪些影响变量相关,或者说,究竟是什么因素影响了结果
贝叶斯分类模型继承了贝叶斯网络的优点并具有良好的分类精度,正受到越来越多的关注,并广泛的应用在欺诈识别、客户管理、医学诊断上、互联网搜索上,比如,利用贝叶斯分类模型建立客户的等级分类,如信用等级、忠诚等级,当新客户出现时,即可以按该分类模型对其等级情况做出分类预测
又比如本文所例举的,根据信用卡用户的信用记录及相关信息建立用户的信用模型,并监测哪些用户会做出贷款拖欠的行为
2.贝叶斯网络模型(1)贝叶斯原理统计学分成两派,一派是传统的频率学派,一派是贝叶斯派,能够在统计学界自成一派,可见其影响
贝叶斯的核心思想在于一个公式P(A|X)=P(X|A)·P(A)/P(X)其中A是随机变量,X是数据,P(X|A)是似然,P(A)是先验分布,P(A|X)是后验分布,P(X)是一个数
这个公式的意义在于,我们可以通过一个经验的概率,加上数据的实践,来得出一个后验的概率,也就是说“经验+数据=结果”
那么将这个原理用在贝叶斯网络上,即将先验贝叶斯网络和数据相结合而得到一个后验贝叶斯网络
那么什么是贝叶斯网络
(2)贝叶斯网络模型概述贝叶斯网络(Bayesiannetwork),又叫概率因果网络、信任网络、知识图等,是一种有向无环图
一个贝叶斯网络由两个部分构成,一个是具有K个节点的有向无环图,图中有节点和连接节点的有向边,节点代表随机变量,有向边代表了节点间的相互关联关系
另一个是与每个节点相关的条件概率表(ConditionalProbabilitiesTable,CPT)P,它表示了节点和父节点之前的相关关系,这个关系就是条件概