ROST 新闻分析工具 (ROST News Analysis Tool 4.5) 用户手册 清华大学新闻研究中心 ROST News Analysis Tool 4.5 目 录 一、功能说明 ............................................. 1 二、运行环境 ............................................. 1 三、软件操作 ............................................. 2 1获取数据 ............................................ 2 1.1搜索新闻 ....................................... 2 1.2查看新闻 ....................................... 3 2词性识别与词性统计 ................................... 3 3社会网络与语义网络分析 ............................... 5 4统计图 .............................................. 7 5新闻汇总数据 ........................................ 8 6数据库操作 .......................................... 9 ROST News Analysis Tool 4.5 1 一、功能说明 采集多个信息源网络数据,并格式化保存。 分词和词性分析 词频统计 词语过滤 人名、地名、团体机构名提取 构建语义网络 数据可视化分析 特定数据来源总体概况 存放于 MDB 库中,并可自由导出 发布、维护新浪微博:@ROST 软件 出品单位:清华大学新闻研究中心 下载地址:http://weibo.com/u/3172254514 二、运行环境 window XP/2003/window 7 互联网 .Net Framework2.0 access 数据库 ROST News Analysis Tool 4.5 2 三、软件操作 程序运行 程序下载到本地电脑后解压文件,依次点击文件ROST NAT→ ROST NewsAnalysis Tools.exe,系统主界面如下图所示: 1 获取数据 1.1 搜索新闻 输入新闻词,点击右侧设置,在弹出的窗口中选择要采集的页数和网址,点击确定 ROST News Analysis Tool 4.5 3 返回到主界面,点击搜索按钮or 鼠标定位到输入新闻词文本框中按下Enter 键,(在搜索的过程中可能会有点卡,常见因素有电脑的网速不是很给力,采集的页数过多,系统同时运行的程序过多等,请耐心等候!)程序会自动生成一系列的相关文本文件,如摘要文件。 (当设置连续采集0 页时,默认采集网站的搜索的最大页数。网页采集的最大页码分别是:搜狗新闻:100 页,搜狗网页:100 页、必应网页:35 页、360 新闻:32 页、360 网页:64 ...