第1页共19页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共19页《信息交换用汉字编码字符集--基本集》—即国家标准GB2312-80从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99
9%,而另外的3000多个累计频度不到0
1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据
1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等
以前我国大陆的各种中文DOS版本、Windows3
2版本,装入的字库都是国标一二级字库
《GB2312-80》对7445个图形字符作了二进制数编码,这些图形字符是:6763个汉字,字体为简化字,分成两级
第一级汉字3755个,按拼音排序,约占近代文献汉字累计使用频度99
9%左右;二级汉字3008个,按部首、笔画排序
一、二级汉字约占累计使用频度99
202个一般符号
,(1)~(20),①~⑩,(-)~(+)等
其中0~9共10个,Ⅰ~Ⅻ共12个
52个拉丁字母
其中大写字母A~Z26个,小写字母a~z26个
169个日文假名
其中平假名83个,片假名86个
48个希腊字母
其中大写字母Α~Ω24个,小写