华南理工大学 《语音信号处理》实验报告 实验名称:M FCC 特征提取 姓名: 学号: 班级:10 级电信 5 班 日期:2013 年 5 月 24 日 1.实验目的 1、熟练运用MATLAB 软件进行语音信号实验; 2、熟悉短时分析原理、MFCC 的原理; 3、学习运用MATLAB 编程进行MFCC 的提取; 4、学会利用短时分析原理提取MFCC 特征序列; 2 . 实验原理 MFCC: 语音识别和说话人识别中,常用的语音特征是基于Mel 频率的倒谱系数(即MFCC)。 MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel 频率可以用如下公式表示: )700/1log(2595ffMel 在实际应用中,MFCC 倒谱系数计算过程如下; ① 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。 ② 求出频谱平方,即能量谱,并用M 个 Mel 带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加,这时第k 个滤波器输出功率谱)(' kx。 ③ 将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L 个 MFCC 系数,一般L 取 12~16 个左右。MFCC 系数为 MkMnkkxCn1']/)5.0(cos[)(log, n=1,2,...,L ④ 将这种直接得到的MFCC 特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。 3 . 实验数据及平台 本实验所采用的数据是语音文件phrase.WAV和 monologue speech_female,平台是 MATLAB。 4 . 实验过程(步骤) ( 1)实验步骤 ① 输入样本音频 ② 给样本音频预加重、分帧、加窗 ③ 将处理好的样本音频做傅里叶变换 ④ 进行Mel 频率滤波 ⑤ 进行Log 对数能量 ⑥ 对样本求倒谱 ⑦ 输出MFCC 图像 ( 2)、MFCC 提取程序流程图 s(n) s(n) X(k) X(k) 图 1 MFCC 特征提取 5 . 实验结果及讨论 运行附录程序,得到的结果为: 1、 采用语音文件phrase.WAV,得到的MFCC 特征提取图像为: 预加重、分帧、加窗 DFT/FFT Mel 频率滤波组 Lo g 对数能量 DCT 求倒谱 2、 采用语音文件monologue speech_female.wav,得到的MFCC 特征提取图像为: 通过计算MFCC 参数,获得了声纹识别的特征参数。由于MFCC 参数是对人耳听觉特征的描述,因此,可以认为,不同声纹的MFCC 参数距离,能够代表人耳对两个语音听觉上的差异,可以为声纹的识别提供可靠的依据。...