社会网络中的数据挖掘方法摘要:随着Web2
0技术的发展,社交网络在人们生活中所起的作用越来越大,社会网络分析越来越多得受到人们的重视,将数据挖掘的方法应用于社会网络分析成为数据挖掘研究的一个新的方向
如何从庞大冗杂的社会网络数据中挖掘出有用的信息成为广大学者研究的问题,并且当前关于社区挖掘的绝大多数方法都假定社会网络中只存在一种关系,挖掘结果并不完全符合用户的真实需求
因此,本文将从节点依赖性着手分析社会网络中数据之间的联系,从链接挖掘入手,分析得出关联分析和聚类分析这两种数据挖掘方法,并在此基础上简要探讨了多关系社会网络的数据挖掘方法
关键字:社会网络;数据挖掘;关联分析;聚类分析;多关系传统的机器学习和数据挖掘任务处理的对象是单独的数据实例,这些数据实例往往可以用一个包含多个属性值的向量来表示,同时这些数据实例之间假设是统计上独立的
然而在社会里,人与人不是简单的统计上独立的采样点,他们之间必然存在着联系和影响
忽视了这种联系会对数据挖掘效果带来很大的影响
为了解决这个问题,必须将数据实例之间的关系同时考虑进来,从而人们提出了社会网络的概念,试图用图结构来刻画这种社会结构
将数据挖掘的方法应用于社会网络分析是数据挖掘研究的一个新的方向
社会网络分析又称为链接挖掘(linkmining),节点代表社会网络中个体或团体,链接表示了个体之间存在的各种关系(relation),如朋友关系、亲属关系、贸易关系、性关系等
通过对链接的挖掘我们可以获得关于实例更丰富(如某个实例在整个网络中的重要性)、更准确(如预测某个实例所属的类别)的信息
近年来,社会网络的个体影响力分析和关键成员挖掘在研究上获得了广泛的关注
通常认为,节点的社会地位可以用一种打分函数进行衡量,而这个打分函数的取值就可以被理解为节点在社会网络上的影响力或权威性
通常权威性函数值大的节点可以被理解为是网络中的重要个