搜索引擎的概念:搜索引擎(searchengine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统搜索引擎的工作原理:抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider)
Spider顺着网页中的超链接,连续地抓取网页
被抓取的网页被称之为网页快照
由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页
处理网页搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务
其中,最重要的就是提取关键词,建立索引文件
其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等
提供检索服务用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息
搜索引擎的作用从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用以百度为例介绍搜素引擎的用法1
搜索,就这么简单只要在搜索框中输入关键词,并按一下按钮,百度就会自动找出相关的网站和资料
百度会寻找所有符合您全部查询条件的资料,并把最相关的网站或资料排在前列
小技巧:输入关键词后,直接按键盘上的回车键(即Enter健),百度也会自动找出相关的网站或资料
什么是关键词关键词,就是您输入搜索框中的文字,也就是您命令百度寻找的东西
您可以命令百度寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文、、、关键词,可以是任何中文、英文、数字,或中文英文数字的混合体
例如,您可以搜索[大话西游]、[windows]、[911]、[F-1赛车]
关键词,您可以输入一个,也可以输入两个、三个、四个,您