前言第一部分:基本原理第二部分:主流标准第三部分:技术分析音频编码的分类按照编码的采样率分语音编码(小于8khz)音频编码(大于8khz)按照编码的方法分波形编码器感知编码器参数编码器不同编码方法的应用波形编码器ADPCM,G
726等特点:基于ADPCM编码
简单预测编码器
感知编码器mp2,AAC,WMA,ATRAC,AC3等特点:基于人耳建模,属于变换编码器
编码内核基于T+SQ
应用:大于8khz的音频编码
参数编码器G
728,CELP,AMR,EVRC等特点:基于人口建模,属于预测编码器
编码内核基于P+VQ
应用:小于8khz的语音编码
人耳模型人耳的听隔soundpressurelevel(SPL)AbsoluteThresholdofHearingCriticalBandsSimultaneousMaskingNon-simultaneousMaskingPerceptualEntropy外耳中耳内耳组成耳翼,外耳道,鼓膜听小骨半规管,前庭窗,耳蜗作用1
声源定位,2
放大20db,共振,头部衍射作用:1
半规管,前庭窗属于主体感受器
耳蜗是听觉受纳器
基底膜:带通特性AbsoluteThresholdofHearing:一个纯音在无声环境下可以被人听到的能量大小巴克谱巴克谱是根据人耳的带通特性总结出的公式
step1:FFTAnalysisstep2:Determinationofthesoundpressurelevelstep3:Consideringthethresholdinquietstep4:Findingoftonalandnon-tonalcomponentsstep5:Decimationoftonalandnon-