【摘要】:与搜索引擎进行对话需要用到关键字,表面上看,人类的自然语言构成了搜索引擎的关键字。但搜索引擎独特的搜索语法又决定着对自然语言的使用,不能简单复制到利用搜索引擎进行的信息搜索中。从实际应用的角度看,搜索引擎的关键字依不同的标准可以有不同的划分,包括按语言要素的大小、关键字的使用频率、关键字的属性特征和不同的文件类型进行划分。 【关键字】:搜索引擎 关键字 单字 词 短语 句子 根据中国互联网信息中心的第 14 次中国互联网发展状况的调查报告,截止到 2004 年 6 月 30 日,中国的上网用户已达到 8700万,在用户使用的各种网络服务中,搜索引擎列第二位,其被使用的频率仅次于电子邮件[1]。这一数据显示搜索服务市场有巨大的潜在商业利益。从使用者的角度来说,用户不管是在雅虎、新浪、搜狐的分类目录里查找信息,还是在 google、百度、中国搜索等专业的搜索引擎网站上搜索信息,都离不开关键词语,即通常所说的搜索引擎中的关键字。 可以说关键字是用户与搜索引擎对话的直接语言,搜索引擎如果没有关键字,庞大的网络信息就无法接近;真正需要的信息也只能是望网络信息这个海洋而兴叹。搜索引擎中的关键字,与图书馆的索引目录有异曲同工之妙,但显然,搜索引擎通过关键字的搜索提供了比图书馆更多的信息,如果掌握了使用关键字的技巧,结合各不同搜索引擎的搜索语法,则搜索引擎给用户带来的海量信息的方便程度、快捷程度则要远远超越传统的图书馆。 但究竟什么是关键字,搜索引擎里的关键字究竟有那些特征,如何针对不同的搜索内容,合理快捷的搜索信息,怕就不是表面看起来的那么简单。通俗来说,关键字就是在搜索引擎网站页面的输入框里所要输入的文字,通常人类的各种自然语言构成搜索引擎的关键字。如果粗略的对关键字进行分类的话,每一种有文字的语言从理论上都构成搜索引擎的关键字,如英文、中文、法文、德文、俄文、西班牙文、日文等关键字,有只支持一种语言的搜索,比如国内的中国搜索(www.zhongsou.com)基本以支持中文搜索为主,有的支持数种语言, 比如通过百度(www.baidu.com)可以搜索到中英文两种语言的信息,国外的teoma 可支持 10 种语言,wisenut 可支持 25 种不同的语言,而google 更是可以支持 34 种语言。 搜索引擎公司通过分析用户使用的字、词组、短语、句子的内容、种类、频率,可以直接分析用户网上的搜索行为,揭示用户对网上信息的兴趣所在。并把这...