汉字的机内码是指在计算机中表示一个汉字的编码
机内码与区位码稍有区别
汉字区位码的区码和位码的取值均在 1~94 之间,如直接用区位码作为机内码,就会与基本 ASCII 码混淆
为了避免机内码与基本 ASCII 码的冲突,需要避开基本 ASCII 码中的控制码(00H~1FH),还需与基本 ASCII 码中的字符相区别
为了实现这两点,可以先在区码和位码分别加上 20H,在此基础上再加 80H(此处“H” 表示前两位数字为十六进制数)
经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示: 高位字节=区码+20H+80H(或区码+A0H) 低位字节=位码+20H+80H(或位码+AOH) 由于汉字的区码与位码的取值范围的十六进制数均为 01H~5EH(即十进制的 01~94),所以汉字的高位字节与低位字节的取值范围则为 A1H~FEH(即十进制的 161~254)
例如,汉字“啊” 的区位码为 1601,区码和位码分别用十六进制表示即为 1001H,它的机内码的高位字节为 B0H,低位字节为 A1H,机内码就是 B0A1H
2603 = 1A03H 区位码 + A0A0H = BAA3H 机内码 [ 本帖最后由 rossini23 于 2006-10-11 13:28 编辑 ] 计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码
汉字信息在系统内传送的过程就是汉字编码转换的过程
汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集— — 基本集” ,代号为 GB 2312— 80,又称为“国标码”
国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出