第1页共3页计算机世界/2007年/1月/29日/第B13版技术专题深入研究人类用语音表达情感的机理,探索不同情感状态下语音的差异以进行转换,可以为语音合成、语音分析、语音识别等提供指导,最终改善人机交互
情感语音的分析与转换崔丹丹蔡莲红情感是语音传情达意的重要成分
在交互过程中,语音的情感承载着丰富的信息,同样文本的语音可能表达出不同的情感和含义
情感语音转换主要关注表达的准确性,追求表达的真实意图和弦外之音
近年来,在信息、娱乐等服务的应用系统中,表现力和情感语音合成成为新的热点
美国早在1990年就由MIT的Cahn构造了一个用声学和语音学来描述发音的计算机程序,用来驱动一个基于规则的语音合成器合成六种基本情感,合成的情感约有50%的识别率
欧洲也启动了PHYSTA(PrincipledHybridSystemsandTheirApplication)项目,目标是开发一个能从脸像和语音识别情感的系统
日本ATR实验室对人类自然语音交流中的情感、意图等非音段信息进行深入分析,并录制和标注了大量的日常生活中的语音数据
国内也开展了情感语音相关的研究,特别是清华大学和中科院心理所合作,将人机交互技术与心理、认知科学相结合,在情感语音计算和处理领域迈出了新的探索之路
情感语音分析与转换的主要工作语音变换的目标是实现语音的个性化,比如实现男女声变换、特定声音音色的变换,而情感变换的目标是实现不同情感的变换,比如原有一个中性(无感情色彩)的声音变成“高兴的”声音
情感声音转换的研究分为情感语音分析和情感语音变换两个部分
情感语音分析的主要工作是收集各种带有不同情感的语音数据、提取声学特征,分析声学特征与情感联系,建立“情感描述词”与“情感状态空间”的映射、“情感空间”与语音特征的映射、训练情感转换模型
而情感语音变换是按照指定的“情感描述词”,利用情感转换模型实现转换