第三章网络信息检索第一节网络信息检索工具与方法第二节搜索引擎及其检索第一节网络信息检索工具与方法一、网络信息检索的特点二、网络信息检索工具三、网络信息检索的方法一、网络信息检索的特点1、存取范围覆盖Internet上所有资源2、传统检索方法与全新检索技术相结合3、用户界面友好且操作方便4、具备良好的导航和编辑功能5、用户透明度二、网络信息检索工具网络信息检索工具按照不同标准可以划分不同类型:1、按照网络信息资源类型划分:WWW检索工具、非WWW检索工具2、按照检索机制划分:关键词检索工具、分类目录检索工具、混合型检索工具3、按照包含检索工具数量划分:单一型检索工具、多元型检索工具4、按照检索内容划分:综合型检索工具、专题型检索工具、特殊型检索工具二、网络信息检索工具查Usenet新闻组资源的WAIS查FTP资源的Archie查Gopher资源的Veronica查Telent资源的Hytelent查查WWWWWW资源资源SearchEngineSearchEngine(搜索引(搜索引擎)擎)其中SearchEngineSearchEngine应用最为普及主要搜索引擎的建立时间及网址•建立年月搜索引擎的名称及网址•1994年4月WebCrawler•http://www.webcrawler.com•1994年5月Lycos•http://www.lycos.com•1994年底Yahoo!•http://www.yahoo.com•1995年初Infoseek•http://www.infoseek.com•1995年10月AltaVista•http://www.altavista.com第二节搜索引擎及其检索一、搜索引擎的构成及工作原理用户检索策略搜索引擎用户接口搜索引擎本地的摘要信息数据库各万维网站点资源访问详细信息反馈摘要信息反馈各记录链接信息资源搜集二、搜索引擎的功能•搜索引擎有两个主要的功能:•1、收集网络信息资源,对其进行•索引并建立数据库。•2、提供网络的信息导航与检索服•务(主要的功能)。搜索引擎的基本检索功能1、布尔逻辑检索逻辑与(与、and、AND、&)AandB——AB逻辑或(或、or、OR、|)AorB——A;B;AB;逻辑非(非、not、NOT、!)AnotB——A—AB2、完全字符串检索采用双引号“”代表字符串精确查找“知识经济”——知识经济o3、截词检索(*)o前方一致检索o扩大检索范围onutri*——nutria+nutrient+onutrilitei+nutrimento+nutrition4、字段限制检索限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。如:URL限制(url:)主机名限制(host:)标题限制(title:)5、位置检索目前只有AltaVista能提供邻近位置运算——near运算。6、+、-检索+:放在检索词前,表示该检索词在检索结果中必须出现。-:放在检索词前,表示该检索词在检索结果中不能出现。几乎所有的搜索引擎都支持这种功能。如:+computer+virus—CIH搜索引擎的高级检索功能1、自然语言检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业HowhasWTOdeveloped?2、模糊检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。相关性检索如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎”、“引擎”等相关的检索词一并列出。3、概念检索用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。如:Excite4、区分大小写检索大多数搜索引擎在查询中要区分大小写小写——匹配大小写字符大写——只匹配大写字符5、管道(|)检索用管道符(|)连接两个或者多个检索词,如apple|disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。6、相关信息反馈检索提供与检索结果类似的检索结果。如:雅虎中国的“相关网站、相关网页、相关新闻”。Lycos的“MoreLikeThis”Excite的“Searchformoredocumentslikethisone”7、范围限制检索在某一范围内检索指定的检索词。分类范围、时间范围、地域范围、信息来源、检索词位置、语种范围、特殊范围三、搜索引擎的分类•1、根据信息检索方式分类:•分类搜索引擎、关键词搜索引擎、混合搜索引擎•2、根据信息...