下载后可任意编辑基于朴素贝叶斯模型的虚假新闻过滤算法讨论基于朴素贝叶斯模型的虚假新闻过滤算法讨论 【摘 要】 社交媒体是一个高度开放和自由的互联网信息传播平台
随着信息媒体数量的增加,随着自媒体的出现,每个人都可以在微信微博等平台上发布和接收信息
由于信息量巨大,准入和访问机制低,给信息沟通带来了极大的便利,同时也出现了大量的谣言
虚假新闻的负面效应极大地影响了国家和社会的和谐稳定和个人日常生活
因此,如何自动有效地识别谣言成为相关领域的讨论热点
针对日常中的假新闻问题,提出一种自动识别虚假新闻的办法,该方法利用计算词向量相关度,结合朴素贝叶斯模型
实验结果显示,该模型在 45548 个数据集上,能够有效识别虚假新闻,验证所提出的方法的可行性和有效性
【关键词】 谣言识别,机器学习,朴素贝叶斯 前 言 自从移动互联网 2
0 时代的到来,中国网民数量开始极具增长,据统计,中国网民数量如今已突破八亿
互联网给人们带来便利的同时,也带了信息爆炸
拿新网微博来说,截至 20XX 年,微博日活跃用户达 2
2 亿人,每天能够产生 1 亿条微博
移动互联网在给公众带来信息便利的同时,也充斥着大量谣言
如今年新冠肺炎疫情中,网络流传由于全球疫情,大米进口量会受到抑制,所以大米会涨价,导致大批民众开始囤积大米,有的甚至囤了一年也吃不完的大米,最后还需要官方辟谣
为了抑制谣言,学术界和相关部门都都开展过讨论,例如微博由经验丰富的专家组成的辟谣团,每天 24 小时对微博实时监控,及时删除谣言微博,同时还实行了谣言众包的模式,每个用户都是谣言监督员,都有权力对谣言微博进行举报,但是由于个人知识有限性,普通大众可能也无法对于一些专业性问题进行辨别,同时,通过专家辟谣的方式,时效性慢,往往辟谣速度远低于谣言传播速度,而且人工推断需要耗费大量的资源
同时,随着自然语言处理的进展,学术界提出了一些