项目名称:海量信息可用性基础理论与关键技术研究首席科学家:李建中哈尔滨工业大学起止年限:2012
1-2016
8依托部门:信息产业部一、关键科学问题及研究内容2
1关键科学问题为了适应海量信息管理基础设施建设的需要,针对国内外海量信息可用性管理的研究现状和发展趋势,本项目将围绕多种类型(不仅仅是关系数据库中存储的关系型)和以多种方式存储(不仅仅是集中式存储)的海量信息,以信息一致性、精确性、完整性、时效性和实体同一性为核心,针对前面提出的五大挑战,以保障信息可用性以及源于信息的知识的可用性为目标,拟解决“量质融合管理”、“劣质容忍原理”、“深度演化机理”三个关键科学问题,创建一套完整的海量信息可用性理论、方法学和技术体系
下边定义拟解决的三个科学问题
量质融合管理量质融合管理是指数据、信息和知识三个层面上的量与质的融合管理机制
现有的海量信息基础设施只关注信息的规模、系统的处理能力和可扩展性,重在“量”的管理,忽视了信息“质量”(简称“质”)的管理
目前,劣质信息普遍存在,已经在实际应用中产生了严重后果,造成了巨大损失
信息质量的管理已经成为目前的巨大挑战问题
为此,我们必须研究信息“质”的管理问题,将信息管理从“量”的管理拓展到“质”的管理,最终实现“量”与“质”的融合管理
信息来源于数据,知识来源于信息
数据的质量决定了信息的可用性,信息的可用性影响知识的可用性
为了彻底实现量质融合管理,我们必须在数据、信息、知识三个层面研究量质融合管理问题,提出完整的理论体系,解决关键技术问题
劣质容忍原理劣质容忍原理是指在包含错误的信息和知识上完成正确或近似计算和推理的原理
数据、信息和知识的错误几乎无处不在已成为不争的事实
“劣质容忍”是指在信息和知识存在错误的情况下,如何完成正确或相对正确的计算
为了实现劣质容忍,我们必须完成如下两个挑战性任务:第一,自动发现并修正信