实验三语音信号的特征提取 一、实验目的 1、熟练运用MATLAB软件进行语音信号实验。 2、熟悉短时分析原理、MFCC、LPC的原理。 3、学习运用MATLAB编程进行MFCC、LPC的提取。 4、学会利用短时分析原理提取MFCC、LPC特征序列。 二、实验仪器设备及软件 HP D538、MATLAB 三、实验原理 1、MFCC 语音识别和说话人识别中,常用的语音特征是基于Mel 频率的倒谱系数(即MFCC)。MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel 频率可以用如下公式表示: )700/1log(2595ffMel 在实际应用中,MFCC 倒谱系数计算过程如下; ① 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。 ② 求出频谱平方,即能量谱,并用M 个 Mel 带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加,这时第 k个滤波器输出功率谱)(' kx。 ③ 将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到 L 个 MFCC 系数,一般 L 取12~16 个左右。MFCC 系数为 MkMnkkxCn1']/)5.0(cos[)(log, n=1,2,...,L ④ 将这种直接得到的MFCC 特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。 2、 LPC 由于频率响应 )(jweH反映 声道的频率响 应和被分析信号的谱包 络,因此用|)(|logjweH做反傅里叶变换求出的LPC 倒谱系数。 通过线性预测分析得到的合成滤波器的系统函数为)1/(1)(1piiizazH,其冲激响应为h(n)。h(n)的倒谱为)(^ nh, 1^^)()(nnznhzH就是说)(^zH的逆变换)(^ nh是存在的。设0)0(^h,将式1^^)()(nnznhzH两边同时对1z求导,得1^1111)(]11log[nnpiiznhzzaz得到11111^1)(npiiipiiinzaziaznhn,于是有 1111^11)()1(nniinpiiziaznhnza令其左右两边z 的各次幂前系数分别相等,得到)(^ nh和ia 间的递推关系 piiniinpnnhaninhpnknhanianhah1^^11^^1^),1()1()(1),()1()()1( ,按其可直接从预测系数{ia }求得倒谱)(^ nh。这个倒谱是根据线性预测模型得到的,又称为LPC 倒谱。LPC 倒谱由于利用线性预测中声道系统函数H(z)的最小相位特性,因此避免了一般同态处...