电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

小波域心理听觉模型VIP免费

小波域心理听觉模型_第1页
1/6
小波域心理听觉模型_第2页
2/6
小波域心理听觉模型_第3页
3/6
第39卷第ll期2OO7年11月哈尔滨工业大学学报JOURNALOFHARBININS’n’兀JTEOFTECHNOLOGYVoL39N饥11Nov.200r7小波域心理听觉模型谭建国,张文军(上海交通大学图像通信与信息处理研究所,上海200030,E—mail:tjg@sjtu.edu.cn)摘要:提出一个简单直接的将频域心理听觉模型转换到小波域,进行小波包滤波器分解音频编码的新方法.该方法利用离散傅里叶变换左右频带的对称性,将频域的掩蔽域值频谱作为一个信号,利用傅里叶反变换和离散小波包变换转换到每一个小波子带,根据掩蔽信号在小波域的能量来控制子带中音频信号的量化步长,利用该方法实现小波包音频编码.关键词:音频编码;小波包分解;心理听觉模型;傅里叶反变换中图分类号:TN911.2l文献标识码:A文章编号:0367—6234(2007)1l一1837一04Psycho-acousticmodelinthewaVeletdomain7rANJian—guo,ZHANGWen-jun(I珊t.0fImageCommuIlication&InfonIlationProcessing,ShaTlg}laiJiaotoIlguniversity,shangIlai200030,chi∞,E-mail:堍@sjtu.edu.cn)Abstract:A8impleanddirectalgorithmtoconVertthepsycho—acousticmodel舶mthefbquencydomaint0waveletdomainispresentedtoperfbrmtheDiscleteWaveletPacket7I'ransfo咖.7rhisalgorithmusesthesym·metryofri曲thambandfhquencyspectmmandlefthanbandfrequencyspectmmintheprocessofDFT(Dis—creteFourierTransfo彻),andmakesthemaskingthresholdinthefkquencydomainasasignal.TheinVerseD兀’andDwPT(DiscretewaveletPacketTI.ansfonll)areusedtoconvertthemaskingsignalintothewaveletdomain.Thewaveletcoemcients’quantizationstepsizeofaudiosigrIalisdeteHninedaccordingtothemaskingsignaleneIgyinthewaveletpacketSubband,andthenwaVeletpacketaudiocodingisrealized.Key、Vords:audiocoding;waveletpacketdecomposition;psycho—acousticmodel;inVeI弓eDFr利用小波分解来实现音频压缩的过程中,将频域的心理听觉模型转换到小波域是重点,也是难点.1993年Sinha和7re而∥o利用小波进行音频压缩,心理听觉模型采用了将量化误差经过小波反变换和傅里叶变换转换到频域,经过反复迭代计算,保证音频信号在小波域的量化失真转换到频域的结果低于心理听觉掩蔽域值,该方法复杂,且不易操作.Philippe和kver口。假定音频信号每一个子带中量化噪声是白噪声,利用当量合成滤波器将量化噪声转换到频域,保证量化失真低于掩蔽域值,该算法也采用了迭代搜索的方法,计算较复杂.M.Rosazurerapl等在Philippe和kver的基础上,假收稿日期:2004—10—09.作者简介:谭建国(1975一),男,博士研究生;张文军(1963一),男,教授,博士生导师设每个子带中在小波域量化噪声映射到频域只影响当前子带及其相邻子带,将每个子带的掩蔽域值从频域转换到小波域最大需用量化误差方差,然后对小波域子带信号进行量化,但是每个小波域子带的量化噪声不仅影响当前子带及相邻子带,而且会在整个频带中扩展,预回声就是这样产生的.本文提出将频域心理听觉模型直接转换到小波域中,然后利用小波域的心理听觉模型对各个子带的小波系数进行量化和编码的新方法,该方法计算简单,而且可以在单通道低于每秒64000bits的情况下,实现近透明的的音频编码.1小波音频的编解码器结构文中的音频编码器输入是以16位编码,采样频率是44100Hz单通道音频信号.采用近似内万方数据哈尔滨工业大学学报第39卷耳中临界带宽的小波包分析滤波器来分解信号.在音频编码中,帧越长,压缩比越大,但是帧越长,越容易产生预回声现象.所以本文根据参考文献⋯的分段熵来判决,将音频信号分解成1024和2048个样本等不同的帧,以避免音频编码中遇到的预回声现象.为了让小波包分解后的小波系数的个数同每帧的样本个数相同,采用周期性的小波包分解,但是周期性常造成帧与帧之间边界出现块效应HJ,本文在相邻的两帧之间交叠64个样本,加平方根汉宁窗.根据第2部分的算法,将心理听觉模型从频域直接转化到小波域,利用小波域的需用域值对各个子带中的小波系数进行均匀量化,将量化后的值进行算术编码,然后同量...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

小波域心理听觉模型

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部