电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

基于广度优先算法的多线程网络爬虫毕业设计

基于广度优先算法的多线程网络爬虫毕业设计_第1页
1/54
基于广度优先算法的多线程网络爬虫毕业设计_第2页
2/54
基于广度优先算法的多线程网络爬虫毕业设计_第3页
3/54
摘 要 目 前 即 使 通 讯 软 件 在 平 常 的 生 活 中 有 着 十 分 广泛 的 应 用 , 但 是 对 绝 大 部 分 的 软 件 来 说 , 都 必 须应 用 在 互 联 网 上 , 必 须 在 一 个 INTERNET 环 境 下 才 能使 用 。 有 时 候 单 位 内 部 的 员 工 , 同 学 , 在 没 有 互联 网 环 境 下 或 因 其 他 原 因 希 望 不 用 INTERNET 就 可 以进 行 信 息 交 互 , 这 样 开 发 局 域 网 通 信 就 有 了 必 要性 。 本 文 提 出 了 局 域 网 信 息 交 互 的 需 求 , 并 详 细对 网 络 协 议 TCP/IP 协 议 族 进 行 了 介 绍 和 讨 论 , 如TCP , UDP , 广 播 等 相 关 技 术 。 并 对 网 络 信 息 交 互原 理 惊 醒 了 说 明 , 在 此 基 础 上 利 用 SOCKET 网 络 编 程实 现 了 一 种 基 于 WINDOWS 平 台 的 局 域 网 信 息 交 互 功能 。网 络 爬 虫 是 一 种 自 动 搜 集 互 联 网 信 息 的 程 序 。 通过 网 络 爬 虫 不 仅 能 够 为 搜 索 引 擎 采 集 网 络 信 息 ,而 且 可 以 作 为 定 向 信 息 采 集 器 , 定 向 采 集 某 些 网站 下 的 特 定 信 息 , 如 招 聘 信 息 , 租 房 信 息 等 。本 文 通 过 JAVA实 现 了 一 个 基 于 广 度 优 先 算 法 的 多线 程 爬 虫 程 序 。 为 何 要 使 用 多 线 程 , 以 及 如 何 实现 多 线 程 ; 系 统 实 现 过 程 中 的 数 据 存 储 ; 网 页 信息 解 析 等 。通 过 实 现 这 一 爬 虫 程 序 , 可 以 搜 集 某 一 站 点 的URLs , 并 将 搜 集 到 的 URLs 存 入 数 据 库 。 将 解 析 的 网页 存 入 XML 文 档 。【 关 键 词 】 网 络 爬 虫 ; SOCKET 编 程 ; TCP/IP ; 网 络编 程 ; JAVA AbstractInstant message software in our daily lives has a very wide range of application , However ,most of the software must be used in the Internet , and it must be used in a Internet environmen...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

基于广度优先算法的多线程网络爬虫毕业设计

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部