2015年10月第41卷第lO期北京航空航天大学学报JournalofBeijingUniversityofAeronauticsandAstronautics0ctober2O15Vo1.41NO.1Ohttpffbhxb.buaa.edu.cnbuaa@buaa.edu.onDOI:10.13700/j.bh.1001—5965.2014.0771汉语双模情感语音数据库标注及一致性检测景少玲,毛峡,陈立江,张娜娜(北京航空航天大学电子信息工程学院,北京100191)摘要:对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数据库的特色制定了详细的标注规则和方法,由5名标注者按照制定的标注规则对情感语音数据库进行标注.其次,为了确保情感语音数据库的标注质量和测试标注规则的完整性,标注者在正式标注之前先进行了测试性标注,测试语音包含280条语音(7种情感X2名说话人×2O条语音).最后,根据语音标注规则设计了相应的一致性检测算法.结果表明,在5ms的时间误差范围内,5名标注者对相同语音标注的一致性平均可以达到60%以上,当误差范围增大至8ms和10ms时,一致性平均可提高5%和8%.实验说明5名标注者对语音的理解较一致,制定的标注规则比较完整,情感语音数据库的质量也较高.关键词:汉语;双模;情感语音数据库;语音标注;一致性检测中图分类号:TP391.4文献标识码:A文章编号:1001.5965(2015)10.1925.10情感语音中含有丰富的情感交流信息,在人们日常生活中起着非常重要的作用,对其研究可以进一步了解人类相应的心理状态,情感语音识别在情感计算和智能交互领域有重要意义.情感语音数据库是情感语音识别、合成等研究的基础.由于情感的复杂性、数据收集的困难性