政治新闻报道中的敏感信息校对方法研究摘要:为实现政治新闻报道内容中的敏感信息校对,提出了一种基于分类和规则的方法
以《新华社新闻信息报道中的禁用词和慎用词》(最新修订版)和相关的中央文件与网络文本提供的重要敏感信息为依据,对敏感信息进行分类,然后,针对不同的类别,设计相应的规则处理算法,构成分类处理规则库,来进行敏感信息校对
实验结果显示,该方法的召回率为89
98%,准确率为98
31%,具有很好的实际应用效果
关键词:政府新闻报道;敏感信息;分类方法;规则一、引言政治性差错,是指由于政治上的认识不清晰、技术上的疏漏等造成的政治性内容的个别差错或者是认识上的不足和马虎、思想上的麻痹大意所造成的政治性失误[1]
这些错误是很难被发现,而且,互联网传播具有匿名性、即时性、互动性、海量性等特点[2],如果政府新闻报道中出现政治性查错等不良信息,轻则给新闻报道带来负面影响,造成政治性差错;重则造成不可挽回的政治影响,成为政治问题[3]
对于这些敏感信息,如果没有认真谨慎的态度、扎实的语言文字功底、较高的政策理论水平和政治敏感性,是很难发现这些问题[4],而且,这些问题,涉及面广,类型较多,没有统一的规范与标准来检验这些问题的真实性和有效性,因此,新华社出台了《新华社新闻信息报道中的禁用词和慎用词》
海量的文本信息已经远远超出人们的理解和概括能力,通过人工的方式去查找有用的信息并凝练知识已变得不可能[5],因此,亟需一种合适的自动查错系统
本文以《新华社新闻信息报道中的禁用词和慎用词》(最新修订版)和相关的中央文件与网络文本提供的重要敏感信息为依据,对网络敏感信息有详细的界定和分类,构建分词库,针对敏感词类型制定敏感信息校对规则库,并对涉及到的规则算法做了详细的介绍,通过分类和规则相结合的方法对文本进行查错,实现政府新闻敏感信息的自动校对
二、政治新闻报道中的政治性错误类型分析政府