信息检索的步骤图分析检索课题分析检索课题1.主题概念2.信息类型3.时间范围4.检索目的构造检索式构造检索式(试验性检索)(试验性检索)1.简单提问式2.上下文提问式3.复合提问式4.结构性提问式调整检索策略调整检索策略(正式检索)(正式检索)1,信息量过多时2.信息量太少时输出检索结果输出检索结果1.文摘2.全文选择检索系统选择检索系统1.学科范围2.系统类型3.系统功能确定检索词确定检索词1.切分2.删除3.替补4.组合5.增加用户评价一、分析检索课题①分析课题的主题内容②确定检索时间范围③确定课题的文献类型④分析检索评价要求⑤分析检索是否有特殊要求分析检索是否有特殊要求二、选择检索系统掌握数据库资源所覆盖的学科范围掌握各种数据收录文献的类型查看数据库的详细介绍和说明三、确定检索词1.切分切分是对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。自由词切分仅适用于自然语言检索。例1:检索“吸烟与肺癌的关系研究”相关文献。直接切分:(吸烟|与|肺癌|的|关系|研究)注意,当词切分后将失去原来的意思时,不应再切分,如“中国科学院”、“电子邮件”2.删除删除自然语言中:不具有实质性检索意义的虚词使用频率较低的词,专指性太高、过分宽泛的词,过分具体的限定词、禁用词,不能表达需求实质的高频词,或者存在蕴含关系可以合并的词三、确定检索词检索“中国IT业的发展前景研究”进行拆分,发展、前景、研究这三个自由词具有一定的检索意义,但是由于意义过于宽泛、不能表达课题实质、存在蕴含关系的原因没有必要全部作为检索词,根据需要可以保留1-2个作为检索词。例2:三、确定检索词3.替补替补就是在进行切分、删除后,对检索词进行规范词汇替换和同义词补充。“公交”应替换为:公共交通;“绿色包装”中的“绿色”,应替换为:环保、无污染、可降解;“煤气中毒”应替换为:一氧化碳中毒;“非典”应考虑补充:SARS、非典型肺炎、传染性非典型肺炎、严重急性呼吸综合征4.增加增加“限义词”。有两种方法:①直接增加限义词、挖掘隐含词、提取潜在的检索词②采用逻辑“与”或逻辑“非”的方法增加限义词。分析隐含概念、挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例1:“吸烟与肺癌的关系研究”,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索词:烟、癌症、恶性肿瘤。三、确定检索词四、构造检索式(试验性检索)所谓的检索提问式(query,searchformulation)是用来表达用户检索提问的逻辑表达式。主要是使用各种布尔逻辑算符等以及系统规定的其他组配连接符号将检索词进行组配,确定检索词之间的概念关系或位置关系。计算机*网络安全-病毒计算机AND网络安全NOT病毒番茄*基因*(果实成熟+果实软化+耐贮藏+衰老+滞绿+叶绿素降解)番茄AND基因AND(果实成熟OR果实软化OR耐贮藏OR衰老OR滞绿OR叶绿素降解)例:检索式实例五、调整检索策略(正式检索)所谓检索策略(searchstrategy)对检索的全过程进行谋划之后所制定的全盘检索方案。在实施检索时,应及时分析:结果与检索的内容、目的和要求是否一致,同时根据检索结果的多少对检索策略进行相应的修改和调整,以获得最佳的查全率和查准率,直至得到比较满意的检索结果为止。五、调整检索策略(正式检索)1.检索结果信息量过多的原因:选用了多义性的检索词;截词截得过短;输入的检索词太少;应该用“与(*)”的使用了“或(+)”;优先运算符“()”使用错误。2.检索结果信息量太少的原因:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;字段算符使用的过多;使用过多的“AND”算符。五、调整检索策略(正式检索)六、获取原始文献满意:打印、Email或存档是否需要获取全文?图书馆期刊、资料。利用利用全文数据库全文数据库直接获取直接获取利用利用文献传递系统文献传递系统获取获取(原文传递服务)利用文摘利用文摘数据库的原文服务数据库的原文服务利用利用OPACOPAC检索系统,进行,进行馆际互借馆际互借