什么是搜索引擎
——第一组一、引擎(yínqíng)【英】engine汉语释义:发动机的核心部分,因此习惯上常用引擎指发动机它是整个汽车的动力源泉
二、搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统
英译searchengine三、搜索引擎的组成搜索引擎的组成搜索器索引器检索器用户接口下一页搜索器的功能是在互联网中漫游,发现和搜集信息
它常常是一个计算机程序,不停地运行
它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死链接和无效链接
返回索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表
返回检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序
检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种
返回用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制
主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息
用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯
用户输入接口可以分为简单接口和复杂接口两种:简单接口只提供用户输入查询串的文本框;复杂接口可以让用户对查询进行限制
四、工作原理抓取网页处理网页提供检索服务抓取网页每个独立的搜索引擎都有自己的网页抓取程序
它会顺着网页中的超链接,连续的抓取网页
被抓取的网页被称之为网页快照
由于互联网中超链接的应用很普遍,理论上,从一定的网页出发,就能搜集到大多数的网页
处理网页搜索引擎抓到网页后,还要做大量的工作,才能提供检索服务
其中,最重要的就是提取关键词,建