资源数据采集技术方案要点YOURLOCompanynumber:【WTUT-WT88Y-W8BBGB-BWYTT-19998】2019资源数据采集技术方案公司名称2011 年 7 月二 O 一一年七月目录第 1 部分概述1
1 项目概况Internet 已经发展成为当今世界上最大的信息库和全球范围内传播知识的主要渠道,站点遍布全球的巨大信息服务网,为用户提供了一个极具价值的信息源
无论是个人的发展还是企业竞争力的提升都越来越多地依赖对网上信息资源的利用
现在是信息时代,信息是一种重要的资源,它在人们的生活和工作中起着重要的作用
计算机和现代信息技术的迅速发展,使 Internet 成为人们传递信息的一个重要的桥梁
网络的不断发展,伴随着大量信息的产生,如何在海量的信息源中查找搜集所需的信息资源成为了我们今后建设在线预订类旅游网重要的组成部分
因此,在当今高度信息化的社会里,信息的获取和信息的及时性
而 Web 数据采集可以通过一系列方法,依据用户兴趣,自动搜取网上特定种类的信息,去除无关数据和垃圾数据,筛选虚假数据和迟滞数据,过滤重复数据
直接将信息按照用户的要求呈现给用户
可以大大减轻用户的信息过载和信息迷失
2 系统建设目标在线预订类旅游网是在线提供机票、酒店、旅游线路等旅游商品为主,涉及食、住、行、游、购、娱等多方面的综合资讯信息、全方位的旅行信息和预订服务的网站
如果用户要搜集这一类网站的相关数据,通常的做法是人工浏览网站,查看最近更新的信息
然后再将之复制粘贴到 Excel 文档或已有资源系统中
这种做法不仅费时费力,而且在查找的过程中可能还会遗漏,数据转移的过程中会出错
针对这种情况,在线预订类旅游网信息自动采集的系统可以实现数据采集的高效化和自动化
3 建设的原则1
1 建设原则由于在线预订类旅游网的数据采集涉及的方面多、数据量大、采集源数据结构多