基于朴素贝叶斯模型的虚假新闻过滤算法研究

下载本文档

阅读 96
下载 29
格式 docx
大小 17.68 KB
约5页
2024-12-19 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/5页

2/5页

3/5页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

下载后可任意编辑基于朴素贝叶斯模型的虚假新闻过滤算法讨论基于朴素贝叶斯模型的虚假新闻过滤算法讨论【摘要】社交媒体是一个高度开放和自由的互联网信息传播平台。随着信息媒体数量的增加，随着自媒体的出现，每个人都可以在微信微博等平台上发布和接收信息。由于信息量巨大，准入和访问机制低，给信息沟通带来了极大的便利，同时也出现了大量的谣言。虚假新闻的负面效应极大地影响了国家和社会的和谐稳定和个人日常生活。因此，如何自动有效地识别谣言成为相关领域的讨论热点。针对日常中的假新闻问题，提出一种自动识别虚假新闻的办法，该方法利用计算词向量相关度，结合朴素贝叶斯模型。实验结果显示，该模型在 45548 个数据集上，能够有效识别虚假新闻，验证所提出的方法的可行性和有效性。【关键词】谣言识别，机器学习，朴素贝叶斯前言自从移动互联网 2.0 时代的到来，中国网民数量开始极具增长，据统计，中国网民数量如今已突破八亿。互联网给人们带来便利的同时，也带了信息爆炸。拿新网微博来说，截至 20XX 年，微博日活跃用户达 2.2 亿人，每天能够产生 1 亿条微博。移动互联网在给公众带来信息便利的同时，也充斥着大量谣言。如今年新冠肺炎疫情中，网络流传由于全球疫情，大米进口量会受到抑制，所以大米会涨价，导致大批民众开始囤积大米，有的甚至囤了一年也吃不完的大米，最后还需要官方辟谣。为了抑制谣言，学术界和相关部门都都开展过讨论，例如微博由经验丰富的专家组成的辟谣团，每天 24 小时对微博实时监控，及时删除谣言微博，同时还实行了谣言众包的模式，每个用户都是谣言监督员，都有权力对谣言微博进行举报，但是由于个人知识有限性，普通大众可能也无法对于一些专业性问题进行辨别，同时，通过专家辟谣的方式，时效性慢，往往辟谣速度远低于谣言传播速度，而且人工推断需要耗费大量的资源。同时，随着自然语言处理的进展，学术界提出了一些解决方案。 1下载后可任意编辑相关技术介绍 1.机器学习谣言识别可以看作是分类问题，而在机器学习中，处理分类问题的经典方法有，支持向量机，朴素贝叶斯，决策树，逻辑回归，集成学习方法等，这些模型均属于监督学习，监督学习基于先验知识。其中，样本特征为X={x1，x2，x3....xn}，表示样本集的 n 个特征，而通过机器学习模型学习特征，然后通过条件概率分布 P（Y|X）或决策...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

基于朴素贝叶斯模型的虚假新闻过滤算法研究

下载后可任意编辑基于朴素贝叶斯模型的虚假新闻过滤算法讨论基于朴素贝叶斯模型的虚假新闻过滤算法讨论【摘要】社交媒体是一个高度开放和自由的互联网信息传播平台

随着信息媒体数量的增加，随着自媒体的出现，每个人都可以在微信微博等平台上发布和接收信息

由于信息量巨大，准入和访问机制低，给信息沟通带来了极大的便利，同时也出现了大量的谣言

虚假新闻的负面效应极大地影响了国家和社会的和谐稳定和个人日常生活

因此，如何自动有效地识别谣言成为相关领域的讨论热点

针对日常中的假新闻问题，提出一种自动识别虚假新闻的办法，该方法利用计算词向量相关度，结合朴素贝叶斯模型

实验结果显示，该模型在 45548 个数据集上，能够有效识别虚假新闻，验证所提出的方法的可行性和有效性

【关键词】谣言识别，机器学习，朴素贝叶斯前言自从移动互联网 2

0 时代的到来，中国网民数量开始极具增长，据统计，中国网民数量如今已突破八亿

互联网给人们带来便利的同时，也带了信息爆炸

拿新网微博来说，截至 20XX 年，微博日活跃用户达 2

2 亿人，每天能够产生 1 亿条微博

移动互联网在给公众带来信息便利的同时，也充斥着大量谣言

如今年新冠肺炎疫情中，网络流传由于全球疫情，大米进口量会受到抑制，所以大米会涨价，导致大批民众开始囤积大米，有的甚至囤了一年也吃不完的大米，最后还需要官方辟谣

为了抑制谣言，学术界和相关部门都都开展过讨论，例如微博由经验丰富的专家组成的辟谣团，每天 24 小时对微博实时监控，及时删除谣言微博，同时还实行了谣言众包的模式，每个用户都是谣言监督员，都有权力对谣言微博进行举报，但是由于个人知识有限性，普通大众可能也无法对于一些专业性问题进行辨别，同时，通过专家辟谣的方式，时效性慢，往往辟谣速度远低于谣言传播速度，而且人工推断需要耗费大量的资源

同时，随着自然语言处理的进展，学术界提出了一些

阳光书坊 + 关注: 实名认证
内容提供者

阳光书坊，传播未来

收藏店铺进入空间

基于朴素贝叶斯模型的虚假新闻过滤算法研究

基于朴素贝叶斯模型的虚假新闻过滤算法研究

您可能关注的文档

相关文档

热门下载

相关标签