Mel域语音质量客观评价测度性能研究陈华伟1,张知易2,靳蕃1(1.西南交通大学信息科学与技术学院,四川成都610031;2.中国电子科技集团公司第三十研究所,四川成都610041)摘要:为了有效进行语音质量客观评价,对以MFSC为特征参数的Mel-SD和以MFCC为特征参数的Mel-CD进行对比分析,研究了特征提取中滤波器构造变化对两种测度的影响,并对Mel-SD中压缩因子的影响加以研究。测试研究表明,Mel-SD性能好于Mel-CD,同时具有对滤波器组构造变化的鲁棒性;Mel-CD对滤波器构造变化比较敏感,在滤波器数目超过13后随着滤波器数目的增加性能下降。Mel-SD在给定的滤波器数目的情况下,有最佳的压缩因子。当在一定的范围内,压缩因子的影响并不严重。最佳压缩因子基本符合对心理声学静态测量实验结论的近似表达。将参数优化的Mel-CD和Mel-SD用于干扰条件下通信系统的语音质量的客观评价,结果表明,Mel-SD性能优于Mel-CD和PESQ,Mel-CD性能则与PESQ相当。关键词:语音质量;客观评价;美尔谱系数;Mel谱失真测度;Mel倒谱系数失真测度中图分类号:TN912.3文献标识码:AAnalysisonPerformanceofObjectiveSpeechQualityMeasuresinMelDomainCHENHua-wei1,ZHANGZhi-yi2,JINFan1(1.SchoolofInformationScience&Technology,SouthwestJiaotongUniversity,SichuanChengdu,610031;2.No.30InstituteofCETC,SichuanChengdu,610041)Abstract:Toevaluatespeechqualityeffectivelyandexactly,Mel-SDandMel-CDarecomparedandanalyzed,especiallyonfeatureextraction.TheeffectsofthestructureofMelfilterbankonbothmeasuresareinvestigated.TheresultshowsthatMel-SDperformancebetterthanMel-CD,whileretainingrobustonvarietyofMelfilterbank.Mel-CDissensitivetostructureofMelfilterbank,anddecreasesitsperformancewhenthesizeofbankisincreased.Basedonoptimalsizeofbank,Mel-SDwastestedbydifferentcompressionfactortofindtheoptimalfactorinassessingspeechquality.Furthermore,optimalMel-SDandMel-CDweretestedbyassessingspeechqualityofcommunicationsystem.ExperimentresultsshowthatMel-SDhasgoodperformance,andperformanceofMel-CDisequivalenttoPESQ.Keywords:SpeechQuality;ObjectiveSpeechQualityEvaluation;MelFrequencySpectralCoefficient;MelSpectralDistortionMeasure;MelCepstralDistanceMeasure在通信系统的研究、设计、发展、运营过程中,需要对设备和系统的性能进行监测,以便进行调整、改进、优化等。在涉及语音信息交流的系统中,评价系统性能优劣的一个重要指标就是系统所传输语音的质量。面对新的通信技术和通信服务的要求,研究灵活、可靠、准确的语音质量评价系统成为国内外研究者努力的目标。Mel-CD是Mel域上的语音质量客观评价方法,在研究和实践中都得到了一定的应用[1~5]。Mel-CD把美尔倒谱系数MFCC(MelFrequencyCesptralCoefficient)作为语音信号的特征描述,并用于表示客观失真距离的计算模型。MFCC考虑了人耳对频率的非线性感知特性,但MFCC本身是同态解卷积的处理,将其作为语音质量客观评价中的语音特征描述时并没有很好地符合听觉生理模型以及感知特性。针对Mel-CD存在的问题,文献[6]提出一种以美尔谱系数MFSC(MelFrequencySpectralCoefficient)为特征参数的语音质量客观评价方法-美尔谱失真测度Mel-SD(MelSpectralDistortionMeasure)。Mel域上的语音质量客观评价与Mel域滤波收稿日期:作者简介:陈华伟(1972-),男,江西宁都人,博士研究生。Email:chw.mail@163.com器的选择有密切的关系,本文将对Mel-SD、Mel-CD与滤波器关系加以研究,并在此基础上,对MFSC中非线性压缩函数变化对Mel-SD性能的影响进行研究。1Mel-CD和Mel-SD典型的基于输入-输出的语音质量客观评价主要由语音信号预处理、特征参数计算、失真计算/判断模型三部分组成,如图1所示。核心部分在于特征参数计算、失真计算及判断模型,不同的客观测度主要区别在于这个两个部分。音调是听觉分辨声音高低时,用于描述这种感觉的一种特性,客观上用频率表示音调,主观上音调的单位用Mel标度。图3...