语音情感识别综述作者:薛文韬来源:《软件导刊》第 09 期 摘要:随着情感计算成为人工智能的一种重要发展方向,语音情感识别作为情感计算的一种重要构成部分,受到了广泛关注。从情感描述模型、语音情感特性、语音情感库、语音情感挑战赛这 4 个方面对语音情感研究现状进行总结,并给出现在语音情感识别技术存在的挑战,以及对应的研究办法。 核心词:语音情感识别;情感描述模型;情感特性;语音情感库;域适应 DOIDOI:10.11907/rjdk.161498 中图分类号:TP391 文献标记码:A 文章编号文章编号:16727800() 作者介绍作者介绍:薛文韬(1991-),男,江苏常熟人,江苏大学计算机科学与通信工程学院硕士硕士,研究方向为语音情感识别。 0 引言 1997 年,美国麻省理工学院的 Picard 专家提出了情感计算(Affective Computing)的概念。情感计算作为计算机科学、神经科学、心理学等多学科交叉的新兴研究领域,已成为人工智能的重要发展方向之一。而语音情感识别作为情感计算的一种重要分支,亦引发了广泛关注。 许多国内外出名大学和科研机构也开始语音情感识别研究,国外如美国麻省理工学院Picard 专家领导的情感计算研究小组,德国慕尼黑工业大学 Schuller 专家领导的人机语音交互小组等;国内如清华大学的人机交互与媒体集成研究所、西北工业大学音频、语音与语言解决组等。 1 语音情感识别 语音情感识别系统重要由前端和后端两部分构成。前端用于提取特性,后端基于这些特性设计分类器。在语音有关应用中,运用比较多的分类器是支持向量机和隐马尔科夫模型。现在,语音情感识别的重点重要集中于特性提取。在传统的语音情感识别中,如何提取含有鉴别性的特性已成为研究的重点。随着数据的大规模增加,传统语音情感识别的前提(训练数据和测试数据含有相似的数据分布)已不能够被满足,研究者提出了迁移学习的概念,运用域适应办法来解决跨库的语音情感识别。 本文将从情感描述模型、语音情感特性、语音情感库、语音情感挑战赛这 4 个方面对语音情感研究现状进行总结,并给出现存语音情感识别的技术挑战及对应的研究办法。 2 情感描述模型 现在重要从离散情感和维度情感两个方面来描述情感状态。 离散情感描述,重要把情感描述成离散的形式,是人们日常生活中广泛使用的几个情感,也称为基本情感。在现在情感有关研究领域使用最广泛的六大基本情感是愤怒、厌恶、恐惧、愉快、悲哀和惊讶。 相对于离散情感描述...