数字语音实验吕佩壕10024134一、实验要求1
编程实现一句话语音的短时能量曲线,并比较窗长、窗口形状(以直角窗和和哈明窗为例)对短时平均能量的影响;2
编程分析语音信号的短时谱特性,并比较窗长、窗口形状(以直角窗和和哈明窗为例)对语音短时谱的影响;3
运用低通滤波器、中心削波和自相关技术估计一段男性和女性语音信号的基音周期,画出基音轨迹曲线,给出估计准确率
二、实验原理及实验结果1
窗口的选择通过对发声机理的认识,语音信号可以认为是短时平稳的
在5~50ms的范围内,语音频谱特性和一些物理特性参数基本保持不变
我们将每个短时的语音称为一个分析帧
一般帧长取10~30ms
我们采用一个长度有限的窗函数来截取语音信号形成分析帧
通常会采用矩形窗和汉明窗
1给出了这两种窗函数在窗长N=50时的时域波形
1矩形窗和hamming窗的时域波形矩形窗的定义:一个N点的矩形窗函数定义为如下:1,00,()nNwn其他Hamming窗的定义:一个N点的hamming窗函数定义为如下:0
46cos(2),010,()nnNNwn其他=这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发020406000
82矩形窗samplew(n)020406000
91hanming窗samplew(n)现(如图1
2):矩形窗的主瓣宽度小(4*pi/N),具有较高的频率分辨率,旁瓣峰值大(-13
3dB),会导致泄漏现象;汉明窗的主瓣宽8*pi/N,旁瓣峰值低(-42
7dB),可以有效的克服泄漏现象,具有更平滑的低通特性
因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗
1对比了这两种窗函数的主瓣宽度和旁瓣峰值
2矩形窗和Hammin