电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

信息检索基本方法教案VIP免费

信息检索基本方法教案_第1页
1/6
信息检索基本方法教案_第2页
2/6
信息检索基本方法教案_第3页
3/6
第五章信息检索的基本方法5.1布尔逻辑检索Booleanlogic由GEORGEBOOLE1815-1864提出,目前大多数搜索引擎都采用与AND,*,&或OR,+,︱非NOT,—,!逻辑“与”:用关系词AND表示(可写作“*”或“&”)。逻辑“与”表示AND所连接的两个检索词必须同时在结果中出现才满足检索条件。逻辑“或”:用关系词OR表示(可写作“+”或“︱”),逻辑“或”表示OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。逻辑“非”:用关系词NOT表示(可写作“andnot”“—”或“!”),逻辑“非”表示NOT后面的那个检索词一定不能在检索结果中出现。例如:校庆AND武汉大学高等教育*中国湖南OR湖北移动学习+泛在学习大学NOT武汉大学玉米–甜玉米例如,用GFsoso检索,电子AND读书笔记电子读书笔记OR读书笔记软件5.2位置限制检索临近检索(ProximitySearch)以Dialog为例,收900多个数据库(1)PRE/0,P/0表示前后词序不能颠倒,中间不能插入其他词,但可以插入符号With,(W)例如:WuhanP/0University(2)PRE/#,P/#表示前后词序不能颠倒,中间可插入一定数量的单词,即插入#个单词。例如:WuhanP/1University检索结果:WuhanMedicalUniversity;WuhanAgricultureUniversity;WuhanTechnologyUniversity;(3)NEAR/0,N/0表示前后词序可以颠倒,但中间不能插入单词。例如:WuhanN/0University检索结果:WuhanUniversity;Wuhan–University;Wuhan,UniversityUniversity,Wuhan;University-Wuhan;UniversityWuhan(4)NEAR/#,N/#表示前后词序可以颠倒,中间可以插入#个单词。例如:WuhanN/1University检索结果:WuhanMedicalUniversity;WuhanAgricultureUniversity;WuhanTechnologyUniversity;UniversityofWuhan;UniversityinWuhan;UniversityatWuhan(5)(s)是sentence的缩写,A(s)B表示A和B必须同时出现在记录的同一个句子或短语中,但次序可以随意改变,A与B之间可以有若干个其他的词。如:resin(s)ester(酯化树脂)【练习】1、查找computer和game的间隔不大于100个单词的网页2、检索“杂交玉米”的外文文献,要求两词间隔1个词,前后次序固定。hybrid、corn答案:1、computernear/100game2、hybridp/1cornhybridw/1corn5.3短语检索(精确检索)(PhraseSearchExactSearch)一般用“”表示。常见类型:(1)机构名称检索:“WuhanUniversity”“TheWorldIntellectualPropertyOrganization”(2)人名检索:如“GeorgeW.Washington”否则可能出现:GeorgeW.BushspokeatWashingtonD.Cabouthumanrights(3)用于专有名称检索:如“informationretrieval”“sleeplessinseattle”电影名电子读书笔记与“电子读书笔记”的检索结果是不同的5.4截词检索(TruncationWildcat)是指在检索式中用专门的截词符号(一般用*表示)表示检索词中的某一部分允许有一定的词形的变化。因此,检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。截词符号可以用*,?,位置可分左截断、右截断、中间截断、左右截断(1)左截断:*physics可检索出physics,biophysics,chemophysics,geophysics等。*ology→Biology,geology,zoology*ism,*graphy(2)右截断:Comput*可检索出Comput,Computing,Computer,Computerized等。econom*,→economy;economic;economics;economical;economist;economize;……(3)中间截断wom*n一个?代表一个字符,结果是woman,women(4)左右截断*toxic*→cytotoxic;neurotoxicities;hepatoxicologic;…表5-1世界上主要数据库截词算符数据库平台1个字符多个字符0或1个字符MEDLINEPubMed*MEDLINE,SCIWOS?*$MEDLINE,CSAProQuest?*Agricola?EBSCO?*#Lexis-Nexis*!SDOL,Springer?*5.5字段限制检索(FieldLimiting)通过对检索词出现的位置进行限定,以实现精确检索。例如:中国有多少政府网站?无固定答案,因该题是一个动态变化的过程。网站的构成规律,斜杠越多,层次越多。例如:http://www.sim.whu.edu.cn/teacher/teach-info.phpcn国家或地区代码,美国没有usedu机构类型代码,如gov表示政府机构;org表示非盈利机构;com表示商业性机构whu表示机构名...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

信息检索基本方法教案

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部