第三章数字媒体及应用学习目的:理解GB2312,GBK和GB18030三种汉字编码标准的内容、关系与应用,熟悉中文文本准备的方法;熟悉图像在计算机中的表示;掌握声音获取的方法与设备;熟悉视频压缩编码的几种标准及其应用
学习重点:中西文编码、图像、声音在计算机中的表示
学习难点:中西文编码、视频压缩编码标准
5.1文本与文本处理文字:一种书面语言,由一系列称为“字符”(character)的书写符号构成
文本(text):文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,是计算机中最常用的一种数字媒体
组成文本的基本元素是字符,字符在计算机中采用二进制编码表示
文本在计算机中的处理过程:文本的准备(例如汉字的输入),文本编辑,文本处理,文本存储与传输、文本展现等,根据应用的不同,各个处理环节的内容和要求可能有很大的差别
一、字符的编码1.西文字符的编码字符集:常用字符的集合
西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成
字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码
字符代码表:字符集中不同字符的编码互相区别,构成该字符集的代码表
ASCII字符集和ASCII码美国标准信息交换码(AmericanStandardCodeforInformationInterchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准
基本的ASCII字符集共有128个字符
96个可打印字符(常用字母、数字、标点符号等)和32个控制字符
特殊字符的ASCII码有空格(32)、A(65)、a(97)、0(48)
标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符
每个字节中多出来的一位一般保持为“0”,在数据传输时可用作奇偶校