摘 要 目 前 即 使 通 讯 软 件 在 平 常 的 生 活 中 有 着 十 分 广泛 的 应 用 , 但 是 对 绝 大 部 分 的 软 件 来 说 , 都 必 须应 用 在 互 联 网 上 , 必 须 在 一 个 INTERNET 环 境 下 才 能使 用 。 有 时 候 单 位 内 部 的 员 工 , 同 学 , 在 没 有 互联 网 环 境 下 或 因 其 他 原 因 希 望 不 用 INTERNET 就 可 以进 行 信 息 交 互 , 这 样 开 发 局 域 网 通 信 就 有 了 必 要性 。 本 文 提 出 了 局 域 网 信 息 交 互 的 需 求 , 并 详 细对 网 络 协 议 TCP/IP 协 议 族 进 行 了 介 绍 和 讨 论 , 如TCP , UDP , 广 播 等 相 关 技 术 。 并 对 网 络 信 息 交 互原 理 惊 醒 了 说 明 , 在 此 基 础 上 利 用 SOCKET 网 络 编 程实 现 了 一 种 基 于 WINDOWS 平 台 的 局 域 网 信 息 交 互 功能 。网 络 爬 虫 是 一 种 自 动 搜 集 互 联 网 信 息 的 程 序 。 通过 网 络 爬 虫 不 仅 能 够 为 搜 索 引 擎 采 集 网 络 信 息 ,而 且 可 以 作 为 定 向 信 息 采 集 器 , 定 向 采 集 某 些 网站 下 的 特 定 信 息 , 如 招 聘 信 息 , 租 房 信 息 等 。本 文 通 过 JAVA实 现 了 一 个 基 于 广 度 优 先 算 法 的 多线 程 爬 虫 程 序 。 为 何 要 使 用 多 线 程 , 以 及 如 何 实现 多 线 程 ; 系 统 实 现 过 程 中 的 数 据 存 储 ; 网 页 信息 解 析 等 。通 过 实 现 这 一 爬 虫 程 序 , 可 以 搜 集 某 一 站 点 的URLs , 并 将 搜 集 到 的 URLs 存 入 数 据 库 。 将 解 析 的 网页 存 入 XML 文 档 。【 关 键 词 】 网 络 爬 虫 ; SOCKET 编 程 ; TCP/IP ; 网 络编 程 ; JAVA AbstractInstant message software in our daily lives has a very wide range of application , However ,most of the software must be used in the Internet , and it must be used in a Internet environmen...