2010,46(29)ComputerEngineeringandApplications计算机工程与应用1引言耳语音是人们的一种语音交流方式
目前对耳语音的研究虽然相对其他语言研究较少,但该研究已日益引起国内外研究机构和科研人员的重视[1]
随着耳语音识别[2-4]、转换[5-6]等研究的逐渐展开,准确地判断出耳语音的起点和终点,可以减少有效数据处理时间,提高识别精度,改善系统性能
研究表明,在语音识别系统中,有一半左右的错误率是由端点检测引起的[7]
因此,进行准确、有效的端点检测是耳语音信号处理中首先要解决的问题
与正常语音相比,耳语音最主要的特点是声带不振动,没有基频,发音很不稳定,信噪比较低[8],容易淹没在嘈杂的背景噪声中,这些给耳语音的端点检测带来较大的困难,正常语音的端点检测算法已不适用于耳语音
文献[9]利用谱熵能反映语音段和非语音段在频谱上的差异,达到耳语音端点检测的目的
文献[10]基于希尔伯特-黄变换(Hilbert-HuangTrans-form,HHT)中的经验模态分解(EmpiricalModeDecomposi-基于HHT瞬时能频值的耳语音端点检测谈雪丹1,顾济华1,赵鹤鸣2,陶智1,韩韬1,吴俊1TANXue-dan1,GUJi-hua1,ZHAOHe-ming2,TAOZhi1,HANTao1,WUJun11
苏州大学物理科学与技术学院,江苏苏州2150062
苏州大学电子信息学院,江苏苏州2150211
SchoolofPhysicalScienceandTechnology,SoochowUniversity,Suzhou,Jiangsu215006,China2
SchoolofElectronicsandInformationEngineering,SoochowUniversity,Suzhou,Jiangsu215021,Ch