第35卷第12期自动化学报Vol.35,No.122009年12月ACTAAUTOMATICASINICADecember,2009基于听觉感知特性的信号子空间麦克风阵列语音增强算法程宁1刘文举1摘要针对麦克风阵列信号子空间语音增强算法的不足,结合人耳的听觉掩蔽效应,提出了改进的信号子空间算法.提出了通过置信度判断来确定噪声子空间维度的方法,在噪声子空间上,通过条件概率的方法估计出噪声功率谱.在此基础上,结合人耳的听觉掩蔽效应给出了线性滤波器的一种合理估计.实验结果表明所提的方法相对于传统算法,更有效地抑制了噪声,在多项语音质量评价指标上都有明显的改进.关键词语音增强,信号子空间,麦克风阵列,听觉掩蔽效应,特征值分解中图分类号TP391PerceptualPropertiesBasedSignalSubspaceMicrophoneArraySpeechEnhancementAlgorithmCHENGNing1LIUWen-Ju1AbstractToaimatthedrawbacksoftheconventionalsubspacemicrophonearrayspeechenhancementmethod,someimprovementsareproposedbyusingmaskingpropertiesofhumanears.Confidencefunctionisusedtodeterminethenoisesubspacedimension.Innoisesubspace,thenoisepowerspectrumisestimatedbytheconditionallikelihood.Then,themaskingpropertiesareincorporatedintothesubspacemethodtoestimatethelinearfilter.Experimentsshowthatcomparedwithconventionalalgorithms,theproposedapproachsuppressesnoisemoreeffectivelyandobtainsasignificantimprovementonobjectivespeechqualitymeasures.KeywordsSpeechenhancement,signalsubspace,microphonearray,maskingproperties,eigen-decomposition麦克风阵列语音增强算法近年来得到了广泛的研究.其中,信号子空间算法具有出色的消除加性宽带噪声的能力[1−4].信号子空间算法将带噪信号空间分解为信号子空间(包含目标信号和噪声)和噪声子空间(只包含噪声),并在信号子空间中估计出目标信号.信号子空间算法的核心在于合理地估计线性滤波器,其要点之一是准确地估计信号子空间维度和噪声功率谱.对信号子空间语音增强算法的研究已证明该算法具有很好的语音增强性能[1−4].尽管信号子空间算法性能优越,但想要完全消除噪声,依然具有相当的难度.通常,信号子空间算法消噪以后,增强语音中依然会存在一定的残余噪声,这些噪声降低了语音的感知质量.为了尽量减少残余噪声对目标语音的影响,人们在大量的实验基础上发现收稿日期2008-08-25收修改稿日期2009-03-13ReceivedAugust25,2008;inrevisedformMarch13,2009国家重点基础研究发展计划(973计划)(2004CB318105),国家高技术研究发展计划(863计划)(20060101Z4073,2006AA01Z194),国家自然科学基金(90820011,60675026,60121302)资助SupportedbyNationalBasicResearchProgramofChina(973Program)(2004CB318105),NationalHighTechnologyRe-searchandDevelopmentProgramofChina(863Program)(20060101Z4073,2006AA01Z194),andNationalNaturalScienceFoundationofChina(90820011,60675026,60121302)1.中国科学院自动化研究所模式识别国家重点实验室北京1001901.NationalLaboratoryofPatternRecognition,InstituteofAutomation,ChineseAcademyofSciences,Beijing100190DOI:10.3724/SP.J.1004.2009.01481人耳的听觉掩蔽效应能够用来实现这一目标.人耳的听觉掩蔽效应是指:在通常情况下,目标语音信号是强信号,而背景噪声相对较弱,这样人耳听觉系统会根据具体的目标语音信号确定频域上的听觉掩蔽阈值,如果使滤波后的残余噪声限制在人耳的听觉掩蔽阈值之下,那么该噪声就不会被人耳感知.经过多年来的研究,这一听觉效应被有效地应用在了语音增强算法中[4−6].只要将增强后的语音中残余噪声的量限制在一定的范围内,就能使其在目标语音的掩蔽下不被人耳感知,从而实现对目标语音的增强.本文在改进了原有的信号子空间算法的基础上,将人耳的听觉掩蔽效应应用在信号子空间算法中,通过限制增强后语音中残余噪声的水平,得到了一种新的算法,使得增强后的语音具有更好的质量.本文首先改进了信号子空间算法,利用噪声子空间中特征值应该相等的特点,用置信度判断其是否相等的方法来确定噪声子空间的维度,根据噪声子空间...