政治新闻报道中的敏感信息校对方法研究分析新闻传播专业VIP免费

下载本文档

阅读 180
下载 19
格式 doc
大小 250 KB
约21页
2024-09-10 发布于山西
收藏
评论
点赞(0)
海报
举报

1/21页

2/21页

3/21页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/21

文本预览下载提示常见问题

政治新闻报道中的敏感信息校对方法研究摘要：为实现政治新闻报道内容中的敏感信息校对，提出了一种基于分类和规则的方法。以《新华社新闻信息报道中的禁用词和慎用词》（最新修订版）和相关的中央文件与网络文本提供的重要敏感信息为依据，对敏感信息进行分类，然后，针对不同的类别，设计相应的规则处理算法，构成分类处理规则库，来进行敏感信息校对。实验结果显示，该方法的召回率为89.98%，准确率为98.31%，具有很好的实际应用效果。关键词：政府新闻报道；敏感信息；分类方法；规则一、引言政治性差错，是指由于政治上的认识不清晰、技术上的疏漏等造成的政治性内容的个别差错或者是认识上的不足和马虎、思想上的麻痹大意所造成的政治性失误[1]。这些错误是很难被发现，而且，互联网传播具有匿名性、即时性、互动性、海量性等特点[2]，如果政府新闻报道中出现政治性查错等不良信息，轻则给新闻报道带来负面影响，造成政治性差错；重则造成不可挽回的政治影响，成为政治问题[3]。对于这些敏感信息，如果没有认真谨慎的态度、扎实的语言文字功底、较高的政策理论水平和政治敏感性，是很难发现这些问题[4]，而且，这些问题，涉及面广，类型较多，没有统一的规范与标准来检验这些问题的真实性和有效性，因此，新华社出台了《新华社新闻信息报道中的禁用词和慎用词》。海量的文本信息已经远远超出人们的理解和概括能力,通过人工的方式去查找有用的信息并凝练知识已变得不可能[5],因此，亟需一种合适的自动查错系统。本文以《新华社新闻信息报道中的禁用词和慎用词》（最新修订版）和相关的中央文件与网络文本提供的重要敏感信息为依据，对网络敏感信息有详细的界定和分类，构建分词库，针对敏感词类型制定敏感信息校对规则库，并对涉及到的规则算法做了详细的介绍，通过分类和规则相结合的方法对文本进行查错，实现政府新闻敏感信息的自动校对。二、政治新闻报道中的政治性错误类型分析政府新闻报道中的敏感信息与敏感词不同，敏感词，是指带有敏感的政治倾向、有可能危害国家利益、影响民族团结等方面的[6]，比较容易产生敏感信息的词，就像“买官卖官”是敏感词但不一定就是敏感信息，也可能是新闻对这种恶性行为的批判。但是，对于不带任何不良信息的词，出现在特定场合，也可能成为敏感信息，比如：“亲自”没有带任何的不良信息，但是，对各级领导同志的各种活动报道，慎用“亲自”等词[7]。为了更好的标识敏感信息，本文将可以产生敏感信息的词，统称为敏感词。2.1相关研究邓一贵等[6]提出的有关敏感词决策树过滤算法中，不依赖词典与分词，使用到了决策树，提高了检索效率，但并没有实现决策树的实时更新以及敏感词的屏蔽替换。张仰森[8]通过研究政治新闻文本的语言学特征，提出了一个政治性差错文本错误侦测规则的一般形式化模型，采用统计与规则相结合的策略实现政治新闻领域文本的语义校对。测试集很小，语料库较匮乏；而且涉及规则库的规模偏小。虽然准确率较高但召回率偏低。傅明建[9]提出了一种基于JavaWeb的敏感词过滤系统，在客户端用户发送数据时，系统能够自动阻断聊天内容，并且将敏感词替换为指定特殊符号关键词的敏感词。但是，这种方法，针对面较窄，可应用于政府新闻敏感信息校对的一小部分，而且，准确率不太高。胡传志[10]提出了一个敏感信息自适应多重过滤模型，从整体和语义角度自适应识别敏感信息。蔡艳婧[4]以网络舆论观点文本为研究对象，结合敏感信息特性，提出融合意见挖据和自然语言处理技术的敏感信息动态特征抽取方法。这两种方法都是针对当前一些敏感信息过滤模型所存在的时间滞后、准确性低、自适应性差等问题，提出的改进措施，而且，语料库相同。但是，语料库中涉及内容不足，其中只包含四种类别，无法针对政府新闻报道中出现的敏感信息做全面而及时的处理。2.2问题描述本文根据这些政治性差错的重要程度和出现频率较高的，分为以下6种错误类型：1.政治性或政策性错误。对于政治性或政策性错误，主要包括有关法律法规类，损害国家利益，影响民族团结或国际关系，涉及领土主权及港台澳问题（尤其是台湾问题）等方面的错误[8]。这类错误，涉及...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

政治新闻报道中的敏感信息校对方法研究分析新闻传播专业

政治新闻报道中的敏感信息校对方法研究摘要：为实现政治新闻报道内容中的敏感信息校对，提出了一种基于分类和规则的方法

以《新华社新闻信息报道中的禁用词和慎用词》（最新修订版）和相关的中央文件与网络文本提供的重要敏感信息为依据，对敏感信息进行分类，然后，针对不同的类别，设计相应的规则处理算法，构成分类处理规则库，来进行敏感信息校对

实验结果显示，该方法的召回率为89

98%，准确率为98

31%，具有很好的实际应用效果

关键词：政府新闻报道；敏感信息；分类方法；规则一、引言政治性差错，是指由于政治上的认识不清晰、技术上的疏漏等造成的政治性内容的个别差错或者是认识上的不足和马虎、思想上的麻痹大意所造成的政治性失误[1]

这些错误是很难被发现，而且，互联网传播具有匿名性、即时性、互动性、海量性等特点[2]，如果政府新闻报道中出现政治性查错等不良信息，轻则给新闻报道带来负面影响，造成政治性差错；重则造成不可挽回的政治影响，成为政治问题[3]

对于这些敏感信息，如果没有认真谨慎的态度、扎实的语言文字功底、较高的政策理论水平和政治敏感性，是很难发现这些问题[4]，而且，这些问题，涉及面广，类型较多，没有统一的规范与标准来检验这些问题的真实性和有效性，因此，新华社出台了《新华社新闻信息报道中的禁用词和慎用词》

海量的文本信息已经远远超出人们的理解和概括能力,通过人工的方式去查找有用的信息并凝练知识已变得不可能[5],因此，亟需一种合适的自动查错系统

本文以《新华社新闻信息报道中的禁用词和慎用词》（最新修订版）和相关的中央文件与网络文本提供的重要敏感信息为依据，对网络敏感信息有详细的界定和分类，构建分词库，针对敏感词类型制定敏感信息校对规则库，并对涉及到的规则算法做了详细的介绍，通过分类和规则相结合的方法对文本进行查错，实现政府新闻敏感信息的自动校对

二、政治新闻报道中的政治性错误类型分析政府

您可能关注的文档

文章天下 + 关注: 实名认证
内容提供者

各种文档应有尽有

收藏店铺进入空间

政治新闻报道中的敏感信息校对方法研究分析新闻传播专业VIP免费

政治新闻报道中的敏感信息校对方法研究分析新闻传播专业

您可能关注的文档

相关文档

热门下载

相关标签

政治新闻报道中的敏感信息校对方法研究分析 新闻传播专业VIP免费

政治新闻报道中的敏感信息校对方法研究分析 新闻传播专业

您可能关注的文档

相关文档

热门下载

相关标签

政治新闻报道中的敏感信息校对方法研究分析新闻传播专业VIP免费

政治新闻报道中的敏感信息校对方法研究分析新闻传播专业