第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共6页字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的
字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识
不注意的人可能对这个不在意,但这些名词有时候实在让人迷惑,对想学习计算机知识的人来说,搞懂它也十分重要,我也是在学习中慢慢了解了一些这方面的知识
ASCII码在计算机内部,所有的信息最终都表示为一个二进制的字符串
每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)
也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定
这被称为ASCII码,一直沿用至今
ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(十进制的32,用二进制表示就是00100000),大写的字母A是65(二进制01000001)
这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0
下面是截图:具体的可以到这个网页上去查下:2、非ASCII编码英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的
比如,在法语中,字母上方有注音符号,它就无法用ASCII码表示
于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号
比如,法语中的é的编码为130(二进制10000010)
这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号
第2页共6页第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第