《语音信号处理》实验4MFCC特征提取

下载本文档

阅读 135
下载 30
格式 pdf
大小 152.23 KB
约6页
2025-02-01 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/6页

2/6页

3/6页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

华南理工大学《语音信号处理》实验报告实验名称：M FCC 特征提取姓名：学号：班级：10 级电信 5 班日期：2013 年 5 月 24 日 1.实验目的 1、熟练运用MATLAB 软件进行语音信号实验； 2、熟悉短时分析原理、MFCC 的原理； 3、学习运用MATLAB 编程进行MFCC 的提取； 4、学会利用短时分析原理提取MFCC 特征序列； 2 . 实验原理 MFCC：语音识别和说话人识别中，常用的语音特征是基于Mel 频率的倒谱系数（即MFCC）。 MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel 频率可以用如下公式表示： )700/1log(2595ffMel 在实际应用中，MFCC 倒谱系数计算过程如下; ① 将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换并得到其频谱。 ② 求出频谱平方，即能量谱，并用M 个 Mel 带通滤波器进行滤波；由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加，这时第k 个滤波器输出功率谱)(' kx。 ③ 将每个滤波器的输出取对数，得到相应频带的对数功率谱；并进行反离散余弦变换，得到L 个 MFCC 系数，一般L 取 12~16 个左右。MFCC 系数为 MkMnkkxCn1']/)5.0(cos[)(log， n=1,2,...,L ④ 将这种直接得到的MFCC 特征作为静态特征，再将这种静态特征做一阶和二阶差分，得到相应的动态特征。 3 . 实验数据及平台本实验所采用的数据是语音文件phrase.WAV和 monologue speech_female，平台是 MATLAB。 4 . 实验过程（步骤）（ 1）实验步骤 ① 输入样本音频 ② 给样本音频预加重、分帧、加窗 ③ 将处理好的样本音频做傅里叶变换 ④ 进行Mel 频率滤波 ⑤ 进行Log 对数能量 ⑥ 对样本求倒谱 ⑦ 输出MFCC 图像（ 2）、MFCC 提取程序流程图 s(n) s(n) X(k) X(k) 图 1 MFCC 特征提取 5 . 实验结果及讨论运行附录程序，得到的结果为： 1、采用语音文件phrase.WAV，得到的MFCC 特征提取图像为：预加重、分帧、加窗 DFT/FFT Mel 频率滤波组 Lo g 对数能量 DCT 求倒谱 2、采用语音文件monologue speech_female.wav，得到的MFCC 特征提取图像为：通过计算MFCC 参数，获得了声纹识别的特征参数。由于MFCC 参数是对人耳听觉特征的描述，因此，可以认为，不同声纹的MFCC 参数距离，能够代表人耳对两个语音听觉上的差异，可以为声纹的识别提供可靠的依据。...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

《语音信号处理》实验4MFCC特征提取

华南理工大学《语音信号处理》实验报告实验名称：M FCC 特征提取姓名：学号：班级：10 级电信 5 班日期：2013 年 5 月 24 日 1

实验目的 1、熟练运用MATLAB 软件进行语音信号实验； 2、熟悉短时分析原理、MFCC 的原理； 3、学习运用MATLAB 编程进行MFCC 的提取； 4、学会利用短时分析原理提取MFCC 特征序列； 2

实验原理 MFCC：语音识别和说话人识别中，常用的语音特征是基于Mel 频率的倒谱系数（即MFCC）

MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合

Mel 频率可以用如下公式表示： )700/1log(2595ffMel 在实际应用中，MFCC 倒谱系数计算过程如下; ① 将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换并得到其频谱

② 求出频谱平方，即能量谱，并用M 个 Mel 带通滤波器进行滤波；由于每一个频带中分量的作用在人耳中是叠加的

因此将每个滤波器频带内的能量进行叠加，这时第k 个滤波器输出功率谱)(' kx

③ 将每个滤波器的输出取对数，得到相应频带的对数功率谱；并进行反离散余弦变换，得到L 个 MFCC 系数，一般L 取 12~16 个左右

MFCC 系数为 MkMnkkxCn1']/)5

0(cos[)(log， n=1,2,

,L ④ 将这种直接得到的MFCC 特征作为静态特征，再将这种静态特征做一阶和二阶差分，得到相应的动态特征

实验数据及平台本实验所采用的数据是语音文件phrase

WAV和 monologue speech_female，平台是 MATLAB

实验过程（步骤）（ 1）实验步骤 ① 输入样本音频 ② 给样本音频预加重、分帧、加窗 ③ 将处理好的样本音频做傅里叶变换 ④ 进

小辰3 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

《语音信号处理》实验4MFCC特征提取

《语音信号处理》实验4MFCC特征提取

您可能关注的文档

相关文档

热门下载

相关标签