88搜索引擎搜索引擎8
1网络搜索引擎的诞生与发展网络搜索引擎的诞生与发展•1
搜索引擎诞生的原因:•2
搜索引擎的发展过程:•第一个成功的搜索引擎是WebCrawler,它由华盛顿大学于1994年4月推出
随之而来的是一大批网络搜索引擎如雨后春笋般地涌现:Lycos、Infoseek、OpenText、AltaVista、Excite相继诞生为网络信息检索立下汗马功劳
目前,国内外著名的搜索引擎很多:Yahoo,Google,FastSearch,NorthernLight和Sohu,百度,天网,指南针等都是众多搜索引擎的代表
•搜索引擎的分类•从搜索层次上分为两类:•常规搜索引擎和元搜索引擎•从信息媒介分:•图像搜索引擎、视频搜索引擎、网页搜索引擎•从信息源的广度:•综合办搜索引擎、专业搜索引擎•网页制作方式和处理方式:•WEB目录式、全文数据库式、WEB结构分析型•搜索引擎的发展趋势:•个性化•智能化•整合化•垂直化•移动化•开放式•8
2搜索引擎的系统结构搜索引擎的系统结构•建立搜索引擎是将无序的网络信息资源进行有序化组织的有效方法
一个搜索引擎一般由搜索器(Spider),索引器(Indexer),索引数据库(IndexDatabase),检索器(Searcher),和用户接口(UserInterface)等五个部分组成
1搜索器•是从因特网上采集信息的程序,也称之网络机器人
功能是在网上漫游,不断从网上采集并及时传回相关信息
•搜索器搜集信息的主要采集策略:•网页选取策略:•1、从网址集开始,逐步扩大到整个互联网
•2、从国家、或地区、或域名划分开始展开•3、从网站类别划分,对一类网络穷尽搜索•重复爬取策略:制定搜的时间,不用时时搜
•友好性策略:设定搜的页面范围,不用全面搜
•并行爬取策略:协调不同的搜索程序
•由于互联网上无数的网站页面