图书情报论坛2006年第4期(总第72期)图书情报论坛2006年第4期(总第72期)·佘正平文摘搜索引擎是一个集多种技术于一体的综合性系统
从检索方式将搜索引擎分为独立型搜索引擎和元搜索引擎,分别阐述了其各自的工作原理及它们存在的问题,指出了未来搜索引擎的发展趋势将以用户为中心,提供更加个性化的用户服务
关键词搜索引擎独立型搜索引擎元搜索引擎信息检索1引言网络信息的飞速增长极大地改变了人们获取信息的方式,面对浩如烟海的网络信息,如何才能迅速、方便地获取有效信息,日益成为人们关心的问题,搜索引擎的出现极大地缓解了这一矛盾
搜索引擎是一种应用在Web上的软件系统,它以一定的策略在Web上搜集和发现信息,并对信息进行分析、提取、组织等处理后形成供检索用的数据库
目前,各类搜索引擎层出不穷,且不断地完善发展
了解和掌握搜索引擎最基本的原理及存在的问题,不仅可为网络检索工具的开发设计,提供有益的参考意见,而且可为网络用户利用好搜索引擎提供良好的帮助
2搜索引擎的工作原理1990年加拿大麦吉尔大学计算机学院的师生开发了一个软件Archie,提供查找分布在各个FTP主机中文件的服务,该软件被公认为现代搜索引擎的鼻祖
由此以后,各种搜索引擎应运而生,比较著名的Google、Yahoo
、Lycos、Overture、Metacrawler、百度、搜狐、新浪、网易、天网、万纬、搜星等
根据技术原理,就检索方式而言,搜索引擎可分为独立型搜索引擎和元搜索引擎
1独立型搜索引擎独立型搜索引擎(singlesearchengine)又称为单一搜索引擎,其显著特点是,都有一个与数据库绑在一起的检索系统,有一个自动检索程序经常搜集Internet的内容,并将找到的信息资源送回集中管理的数据库
独立型搜索引擎系统一般由三部分构成:信息搜集模块、分析索引模块和检索服务模块
信息搜集模块采用一种像真人一样