多媒体技术与网页设计多媒体技术与网页设计主编:陈新龙第四章多媒体数据压缩与存储技术读者学习本章应重点掌握数据压缩的含义、基本途径与方法;理解熵函数的概念,Huffman编码、预测编码的基本理论;理解JPEG、MPEG的含义及其编码过程;理解CD-ROM中二进制数据的表示方法,物理格式与逻辑格式;理解CD-ROM与DVD-ROM的异同,能利用刻录软件制作光盘。本章建议学时数:8学时。学时数较少时可适当调整本章内容。第1课在本次课中,我们将介绍多媒体数据压缩的一般知识及其实现压缩的一般途径。一、数据压缩的含义我们先来看一个典型的数字传输系统模型:如图示,一个数字传输系统包括信源编码、信道编码、调制、传输、解调、信道解码、信源解码几个过程。信源编码主要解决有效性问题。信道编码主要是解决可靠性问题。信源编码的目的便是数据压缩,它构成了数据压缩的基础。什么是数据压缩呢?数据压缩就是以最少的数码表示信源所发出的信号,减少容纳给定消息集合或数据采样集合的信号空间。二、数据压缩的必要性从传输的角度来看:数字电话传输率最低,按μ律或A律PCM编码,其数码率为64kbps;一路PAL制式彩色电视信号经数字化以后,其数码率大于100Mbps,若要实现实时传输,至少需要占用上述的数字话路1600个以上;采用电信新业务,宽带ISDN(2M带宽)传输,至少需要占用上述的数字话路50个以上。从存储的角度来看:一张CD-ROM光盘仅能保存不到一分钟的数字视频,多媒体数据其数据量之大可见一斑。三、数据压缩的可能性1.空间冗余2.时间冗余3.结构冗余4.知识冗余5.视觉冗余6.图像区域相同性冗余7.纹理的统计冗余四、数据压缩的历史数据压缩技术几乎是与通信系统的发展同时发展。1948年,香侬的经典论文“通信的数学原理”中首次提到信息率-失真函数概念,1959年他又进一步确立了率失真理论,从而奠定了信源编码的理论基础。五、数据压缩的过程对模拟信号进行压缩可分为采样、量化、编码三个过程。1.采样多媒体数据压缩是指数字信号压缩,对模拟信号进行压缩的第一步是采样,采样完成模拟信号的离散化。如果采样满足采样定律,那么,数据率和信噪比取决于代表每个样值的比特位数,这便是量化问题。2.量化用有限个数字0和1表示某一电平范围的模拟离散电压信号称为量化。以有限个离散值近似表示无限个连续值一定会产生误差,这种误差称为量化误差,由此造成的失真称为量化失真。对于给定取样数据,进行量化并设计量化器时主要考虑两个因素:给定量化电平数J,希望量化失真最小;给定量化噪声或失真要求,,希望量化电平数J最少。量化器可分为标量量化和矢量量化两大类。3.标量量化标量量化(ScaleQuantization,SQ)也称无记忆量化、零记忆量化,它每次只量化一个模拟取样值且本次量化结果不影响下一次量化。(1)均匀量化设x∈[aL,am]为量化器输入信号幅值,p(x)为其概率密度函数,则有:均匀量化为非最佳量化(2)最佳量化最佳量化可按均方误差最小来定义4.矢量量化大多数实际信号各样值之间总是相互关联、彼此不独立。如果能进一步利用这些相关性,无疑能进一步提高压缩效率。这种量化器称为带记忆的量化器,如DPCM。带记忆的量化器也称矢量量化(VectorQuantization,简写VQ)。给定NK•个信号样值组成信源序列{xi},每K个数据分为一组,NK•个信号样值分为N个K维随机矢量,构成信源空间XX={X1,X2,...,XN}(X在K维欧几里德空间RK中)。再把RK无遗漏地划分成J=2n个互不相交的子空间R1,R2,...,RN在每一个子空间Ri中找一个代表矢量Yi,令恢复矢量集Y={Y1,Y2,...,YJ}Y也叫输出空间,码书或码本,Yi称为码矢(codevector)或码字(codeword),Y内矢量的数目J,则叫码书长度。当矢量量化器输入任意矢量Xj∈RK时,它首先判断Xj属于哪个子空间,然后输出该子空间Ri的代表矢量Yi[Yi∈YRK,i=1,2,...,J]。一句话,矢量量化过程就是用Yi代表Xi。矢量量化原理如图4-2示:六、数据压缩的的种类多媒体数据压缩方法的分类方法有:依有无失真可分为:有损压缩和无损压缩依其作用域在空间域或频率域可分为:空间方法、变换方法和混合方法。依是否自适...