现代信息检索MODERNINFORMATIONRETRIEVAL第一章信息检索的相关概念提纲信息检索的基本概念信息检索的历史信息检索和其他学科的关系信息检索的基本流程提纲信息检索的基本概念信息检索的历史信息检索和其他学科的关系信息检索的基本流程信息检索的基本概念信息检索产生信息检索简介信息检索概念信息检索的基本概念信息检索产生信息检索简介信息检索概念信息过载(INFORMATIONOVERLOAD)全世界每年产生1到2EB(1EB≈1018B)信息,相当于地球上每个人大概产生250MB信息,其中纸质信息仅占所有信息的0
3%(Lyman&Hal03)静态网页有上百亿,动态及隐藏网页至少是静态网页的500倍
TomLandauer认为人的大脑只能存储量,一辈子只能接触6G的信息量
INTERNET增长(1)INTERNET增长(2)全球数字化进程加快1998年,美国前副总统戈尔提出数字化地球的概念
1998年,江泽民总书记提出数字中国战略构想
1999年,北京市市长刘淇提出数字北京概念
全世界启动了数字图书馆、数字博物馆在内的一系列工程,另外包括虚拟博物馆、数字电影、交互电视、会议电视、远程教育、遥感、GPS等在内的服务或应用也产生大量文本和多媒体数据
一方面,人们可以获得的信息的来源非常广泛
另一方面,人们如何快速、准确、全面地获得自己所需要的信息
信息量太大,而且信息冗余度大、质量良莠不齐、格式不一、位置分散、关联复杂、语言繁多用户需求的表达和理解非常困难信息的理解非常困难—自然语言文本、图片、视频信息检索是研究如何解决上述问题的一门学科
IR系统用户需求相关结果信息检索的基本概念信息检索产生信息检索简介信息检索概念信息检索信息检索简介(1)InformationRetrieval这个术语产生于