基音周期检测——自相关函数法 一、基音周期相关知识简介 人在发音时,根据声带是否震动可以将语音信号分为清音跟浊音两种。浊音又称有声语言,携带着语言中大部分的能量,浊音在时域上呈现出明显的周期性;而清音类似于白噪声,没有明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期[4]。 通常,基音频率与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关系,在很大程度上反应了个人的特征。此外,基音频率还跟随着人的性别、年龄不同而有所不同。一般来说,男性说话者的基音频率较低,大部分在 70~200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在 200~450Hz之间。 基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。 基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此。汉语是一种有调语言,而基因周期的变化称为声调,声调对于汉语语音的理解极为重要。因为在汉语的相互交谈中,不但要凭借不同的元音、辅音来辨别这些字词的意义,还需要从不同的声调来区别它,也就是说声调具有辨义作用;另外,汉语中存在着多音字现象,同一个字的不同的语气或不同的词义下具有不同的声调。因此准确可靠地进行基音检测对汉语语音信号的处理显得尤为重要。 二、自相关函数法原理 能量有限的语音信号 ( )s n的短时自相关函数 [10 ][11]定义为: 10( )[ ()()][ ()()]NnmRs nm wms nmwm (2.1) 其中, 为移位距离,()wm 是偶对称的窗函数。 短时自相关函数有以下重要性质: ①如果 ( )s n是周期信号,周期是 P ,则( )R 也是周期信号,且周期相同, 即( )()RR P。 ②当τ =0时,自相关函数具有最大值;当0,,2,3PPP „处周期信号的自相关函数达到极大值。 ③自相关函数是偶函数,即( )()RR。 短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。 在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,...