基于CNKI的搜索引擎论文学术影响力分析摘要:阐述CNKI搜索引擎的功能,对CNKI搜索引擎的特点进行了分析,指出CNKI搜索引擎的不足,对CNKI搜索引擎的发展方向提出建议,指出CNKI搜索引擎的发展趋势是:多元化、个性化、智能化和多媒体化关键词:CNKI的搜索引擎;学术搜索引擎;学术影响力分析前言:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统
其工作作原理分为抓取网页,处理网页和提供检索服务
抓取每个独立的搜索引擎都有自己的网页抓取程序,它顺着网页中的超链接,连续地抓取网页
由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务
其中,最重要的就是提取关键词,建立索引文件
来源数据库序号来源数据库篇数1中国学术期刊网络出版总库’44352特色期刊2353中国博士学位论文全文数据库304中国优秀硕士学位论文全文数据库11455中国重要会议论文全文数据库1226国际会议论文全文数据库117中国重要报纸全文数据库7878中国学术辑刊全文数据库14从表格可以看出来,不同的数据库之间的篇数差距还是比较大的,篇数最多的来源数据库是中国学术期刊网络出版总库,篇数多达4435篇,说明中国学术期刊网络出版总库关于CNKI搜索引擎的内容是比较齐全的,而国际会议论文全文数据库仅收录了11篇,与最多的收录的来源数据库差距有400倍,并且从表格中可以看出来,各个数据库来源之间的差距比较大,这些都说明关于CNKI搜索引擎的文献的分布不是很均匀,或者说是不同的来源数据库对它的关注不一样
2.学科序号学科篇数序号学科篇数1计算机软件及计算机应用315511医学教育与医学边缘学科612互联网技术1123