摘 要随着互联网的不断发展和日益普及,网上的信息量在迅速地增长,在 2004 年 4 月,全球 Web 页面的数目已经超过 40 亿,中国的网页数估计也超过了 3 亿。 目前人们从网上获得信息的主要工具是浏览器,搜索引擎在网络中占有举足轻重的地位,本文将在此深入的对搜索引擎做一个研究与阐述。并且详细介绍了基于因特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web 服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个简单的搜索引擎 Damon。关键词: 1、jsp 搜索引擎 2、spider 3、Lucene1 目 录一、前言.................................................6二、搜索引擎的历史渊源...................................7三、搜索引擎基本结构.....................................9(一)网络机器人....................................9(二)索引与搜索....................................9(三)Web 服务器....................................10(四)搜索引擎的主要指标及分析.....................10四、网络机器人 ........................................11(一)什么是网络机器人.............................11(二)网络机器人的结构分析.........................11(三)Spider 程序结构...............................12(四)如何提高程序性能.............................13五、基于 Tomcat 的 Web 服务器 jsp 搜索引擎程序设计详解.....14(一)开发工具、平台及资源 .......................14(二)Lucene 开源组件简介...........................14(三)引入基于 Tomcat 的 Web 服务器开发设计...........15(四)用户接口设计.................................16(五)机器人的设计分析.............................18(六)关于程序说明.................................23六、在 Tomcat 上部署项目.................................24七、总结................................................25致谢....................................................26参考文献................................................27一、前言在网络迅速发展的今天,面临非常丰富的网络资源,不论我们是学习、研究、还是工作需要在网络上能查找到相关的资料信息,人们现在对网络的依赖程度越来越高,但是如何有效的搜索信息却是一件困难的...