Un ico de 汉字编码表 1 Un ico de 编码表 Un ico de 目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x 7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x 开头,0x 7ECF 转换成十进制 就是32463,UCS-2 用两个字节来编码字符,两个字节就是16位二进制, 2 的16 次方等于65536,所以UCS-2 最多能编码65536 个字符。 编码从 0 到 127 的字符与ASCII 编码的字符一样,比如字母"a"的Un ico de 编码是0x 0061,十进制是97,而"a"的ASCII 编码是0x 61,十进制也是97, 对于汉字的编码,事实上 Un ico de 对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而 UCS-2 最多能表示65536 个,才六万 多个,所以Un ico de 只能排除一些几乎不用的汉字,好在常用的简体汉字 也不过七千多个,为了能表示所有汉字,Un ico de 也有 UCS-4规范,就是用 4 个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来 编码,看一下 Un ico de 对汉字的编码: ------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏 4e10 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟 4e20 丠 両 丢 丣 两 严 並 丧 丨 丩 个 丫 丬 中 丮 丯 4e30 丰 丱 串 丳 临 丵 丶 丷 丸 丹 为 主 丼 丽 举 丿 4e40 乀 乁 乂 乃 乄 久 乆 乇 么 义 乊 之 乌 乍 乎 乏 4e50 乐 乑 乒 乓 乔 乕 乖 乗 乘 乙 乚 乛 乜 九 乞 也 4e60 习 乡 乢 乣 乤 乥 书 乧 乨 乩 乪 乫 乬 乭 乮 乯 4e70 买 乱 乲 乳 乴 乵 乶 乷 乸 乹 乺 乻 乼 乽 乾 乿 4e80 亀 亁 亂 亃 亄 亅 了 亇 予 争 亊 事 二 亍 于 亏 4e90 亐 云 互 亓 五 井 亖 亗 亘 亙 亚 些 亜 亝 亞 亟 4ea0 亠 亡 亢 亣 交 亥 亦 产 亨 亩 亪 享 京 亭 亮 亯 4eb0 亰 亱 亲 亳 亴 亵 亶 亷 亸 亹 人 亻 亼 亽 亾 亿 4ec0 什 仁 仂 仃 仄 仅 仆 仇 仈 仉 今 介 仌 仍 从 仏 ...