搜索引擎进展历史搜索引擎进展历史 1990 年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出 Archie。当时,万维网(World Wide Web)还没有出现,人们通过 FTP 来共享沟通资源。Archie 能定期搜集并分析 FTP 服务器上的文件名信息,提供查找分别在各个 FTP 主机中的文件。用户必须输入精确的文件名进行搜索,Archie 告诉用户哪个 FTP 服务器能下载该文件。虽然 Archie 搜集的信息资源不是网页(HTML 文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie 被公认为现代搜索引擎的鼻祖。 Robot(机器人)一词对编程者有特别的意义。Computer Robot 是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的 Robot 程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的 Robot 程序被称为 spider 程序。 1993 年 Matthew Gray 开发了 World Wide Web Wanderer,这是第一个利用 HTML 网页之间的链接关系来检测万维网规模的“机器人(Robot)”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。 1994 年 4 月,斯坦福大学(Stanford University)的两名博士生,美籍华人 Jerry Yang(杨致远)和 David Filo 共同创办了 Yahoo。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为 Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于 2024 年 12 月 23 日收购 inktomi,2024 年 7 月 14 日收购包括 Fast 和 Altavista 在内的 Overture,2024 年 11 月,Yahoo 全资收购 3721 公司。 1994 年初,华盛顿大学(University of Washington )的学生 Brian Pinkerton 开始了他的小项目 WebCrawler。1994 年 4 月 20 日,WebCrawler 正式亮相时仅包含来自 6000 个服务器的内容。WebCrawler 是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过 URL 和摘要搜索,摘要一般来自人工评论或程序自动取正文的前 100 个字。 1994 年 7 月,卡内基·梅隆大学(Carnegie Mellon University) 的 Michael Mauldin 将John Leavitt 的 spider 程序接入到其索引程序中,创建了 Lycos。除了相关性排序外,Lycos还提供了前缀...