下载后可任意编辑附件 2:重大讨论计划“视听觉信息的认知计算”2024 年度项目指南与人类视听觉感知密切相关的图像、语音和文本(语言)信息在社会、经济和国家安全等领域中扮演着重要角色,并在今后一段时间内仍将迅猛增长。这类信息可被人类直接感知和理解,也可用计算机进行处理,但计算机的处理能力远逊于人类且处理效率远不能满足当今社会的进展需求。如何借鉴人类的认知机理和相关数学的最新讨论成果,建立新的计算模型和方法,从而大幅度提高计算机对这类信息的理解能力与处理效率,不仅可有力推动信息科学的快速进展,也将为国民经济和社会进展做出重大贡献。一、科学目标本重大讨论计划的总体科学目标是:围绕国家重大需求,充分发挥信息科学、生命科学和数理科学的交叉优势,从人类的视听觉认知机理出发,讨论并构建新的计算模型与计算方法,提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率,克服图像、语音和文本(语言)信息处理所面临的瓶颈困难,为确保国家安全与公共安全、推动信息服务及相关产业进展以及提高国民生活和健康水平做出重要贡献。具体表现为:在视听觉信息处理的基础理论讨论方面取得重要进展;在视听觉信息协同计算、自然语言(汉语)理解以及与视听觉认知相关的脑―机接口等三项关键技术方面取得重大突破;集成上述相关讨论成果,研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,主要性能指标达到世界先进水平,从而提升我国在视听觉信息处理领域的整体讨论实力,培育具有国际影响力的优秀人才与团队,为国家安全和社下载后可任意编辑会进展提供相关讨论环境与技术支撑。二、核心科学问题本重大讨论计划将围绕“感知特征提取、表达与整合”、“感知数据的机器学习与理解”和“多模态信息协同计算”等核心科学问题,组织并实施如下四个主要方面的讨论工作。(一)图像与视觉信息计算。主要讨论图像与视觉信息计算的认知机理,视觉基本特征的提取与选择,物体识别与图像内容理解,复杂场景下运动目标的行为分析等。提出若干图像与视觉信息的高效计算模型,取得国际公认的原创性讨论成果(在 Nature, Science, IEEE Trans. PAMI 等刊物上发表高水平论文),培育具有国际影响力的优秀人才与讨论团队。(二)语音与听觉信息计算。主要讨论听感知机理与音频场景分析,自然环境下的语音识别与合成,口语对话分析与理解等。取得国际上有影响的原创性讨论成果,提出若干语音...