( 本科毕业设计说明书学校代码: 10128学 号: 040202517题 目 : 搜索引擎的系统体系结构的讨论与应用学 生 姓 名 : 李 敏学 院 : 信 息 工 程 学 院系 别 : 计 算 机 系专 业 : 计 算 机 科 学 与 技 术班 级 : 计 算 机 0 4 - 2 班指 导 老 师 : 苏 依 拉 副 教 授 钱 庭 荣 工 程 师二○○八年六月摘 要近年来,互联网上的信息呈几何级数爆炸性增长,丰富多彩的网络资源给人们的生活工作以及学习带来巨大方便的同时,信息的浩繁,庞杂无序和动态性又极大地影响了用户猎取信息的速度,准确性和有效性。海量的存贮和科学的信息搜索是用户信息行为中两种重要的能力,互联网的进展已经实现了信息的海量存贮,为了解决大海捞针似的信息搜索问题,搜索引擎便应运而生了。目前搜索引擎技术已成为计算机工业界和学术界争相讨论和开发的热点技术。对于实现网络信息的海量搜索,搜索引擎的体系结构设计成为提高搜索效率的关键。本文中所设计的搜索引擎,主要有四个大的模块组成:一是抓取模块:实现了对网页信息的下载。二是索引模块:实现了对网页信息的排序,索引。三是搜索模块:实现了对网页信息的快速检索。四是用户接口:实现了系统的前台操作。本系统是对网站数据及相关数据库数据进行搜索,管理配置了对应数据源和搜索途径,实现了对网络信息的快速搜索。关 键 词 : 搜 索 引 擎 ; 体 系 结 构 ; 索 引AbstractInformation on the internet grows geometrically and explosively in recent years. Diversified resources of network brought great convenience to people's life. At the same time, the voluminous of information, and the dynamic and mixed disorganization also greatly affect the speed ,the accuracy ,and the effectiveness of accessing to information. Massive storage and searching of scientific information is two important capacity of information act. The development of the internet has achieved the storage of a mass of information. The search engine will come into being in order to solve the problem of searching information. At present , technology of search engine has become...