浅论语音编码戴福山(长春理工大学)摘要:本文重要介绍了语音编码的理论基础、办法的分类和几个典型的语音编码办法,分析了多个办法的特点及应用环境,同时简要分析了现在语音编码总体上三个大的发展方向:极低速率语音编码、变速率语音编码和不压缩语音编码,并阐明了它们的应用领域。核心词:语音编码语音编码典型办法语音编码的发展方向引言语音编码是将模拟语音信号数字化的手段.语音信号数字化后,能够作为数字数据来传输、存储或解决,因而含有普通数字信号的优点。在近半个世纪的研究中,各国研究人员做出了大量努力,从人类的发生机理、听觉机理、心理因素以及语音信号的时域特性、频域特性等多个方面进行了大量研究,从不同角度提出了多个信号编码办法。一、概述语音编码是将模拟语音信号数字化的手段.语音信号数字化后,能够作为数字数据来传输、存储、或解决,因而含有普通数字信号的优点。话音数字化的技术基本能够分为两大类:第一类办法是在尽量遵照原波形的前提下,将模拟波形进行数字化编码。其中三种最惯用的技术是脉冲编码调制(CPM)差分PCM(DPCM)和增量调制(△M);第二类办法是对模拟波形进行一定解决,但仅对话音和收听过程中能收听到的话音部分进行编码。第二类语音数字化办法重要与用于窄带传输系统或有限容量的数字存储设备的话音编解码器有关。采用该类技术的设备普通被称为声码器(语音编码器)。声码器技术现在正开始展开应用,特别是用于帧中继和IP上等语音。近年来,由于数字信号解决器体系构造和人类说话与识别方面研究的进步,使话音编解码技术得到快速的发展。新的编解码技术不仅提供模拟转换,并且提供复杂的预测模式,能够分析话音输入,并用最少带宽传输话音。二语音编码的理论基础2.1语音编码的目的为了使信号适于解决、传输和存储,我们需要对语音信号进行压缩,语音编码就是要在确保语音质量的前提下得到尽量少的数据,因此也常把语音编码叫做语音压缩编码。2.2语音压缩编码的可行性(1)语音信号中存在大量冗余信息,即:语音信号样本件含有很强的有关性;浊音语音段含有准周期特性;声道的形状及其变化的速率有限;传输码元的概率分布非均匀。(2)人耳对声音信号中的部分信息不敏感,即人耳对声音中的低频成分比高频成分敏感;人耳对语音信号的相位特性不敏感;人耳中存在“听觉掩蔽(AuditoryMasking)”效应,即某一声音引发听觉器官对另一声音的敏感度下降。掩蔽的程度取决于掩蔽声的强度及掩蔽声与被掩蔽声之间的频率关系。正是由于这些因素的存在,我们才能够对语音信号进行多个各样的解决,理论研究和实际应用中出现的多个编码技术都是以此为基础的。三、语音编码技术原理及应用3.1语音编码的技术分类语音编码重要有三种方式:波形编码、声码器和混合编码,而近年来“感知编码”也逐步开始步入实际应用行列,普通把编码速率低于64kbps的语音编码方式称为语音压缩编码技术.,下面分别介绍这四种编码办法。3.1.1波形编码波形编码针对语音波形进行的,这种办法在减少量化每个语音样本比特数的同时又保持了相对良好的语音质量.波形编码涉及时域编码和频域编码。(1)时域编码时域编码重要有脉冲编码调制(PCM)、差分脉码调制(DPCM)、增量调制(ΔM)、自适应差分脉码调制(ADPCM)、自适应增量调制(ADM)、自适应预测编码(APC)等。线性PCM是用同等的量化级进行量化,没有运用声音的性质,因此信息没有得到压缩,对数PCM运用了语音信号幅度的统计特性,对幅度按对数变换压缩,将压缩的成果作线性编码,在接受端解码时,按指数扩展,这种办法在数字电话通信中得到了广泛的应用,PCM最大缺点是数码率高,在传输时所占频带较宽。差分脉码调制(DPCM)是根据相邻采样值的差值信号进行编码,图1是DPCM原理方框图。ADPCM是在DPCM的基础上发展起来的,其量化器与预测器的参数能根据输入信号的统计特性自适应于最佳或靠近于最佳参数状态.ADPCM是语音编码中复杂程度较低的一种办法。增量调制是根据信号的瞬值与否增大或减小,即根据增量编码,用一位二进制码序列对模拟信号进行编码.这种办法简朴,实现容易,但由于量阶固定,量化噪声功率固定,因此当信号下降时,信噪比(SNR)下降.为了改善这种办法的动态范畴,引进了自适...