GB2312/GBK/GB18030/BIG5 的历史

来源:百度文库 编辑:神马文学网 时间:2024/06/03 04:53:48
GBK中的“K”是扩展的意思,而GB2312中的“2312”以及GB18030中的“18030”是国家标准的代号,BIG5是港澳台地区的编码。
下面详细介绍一下字库情况,你就可看出其区别:
(一)GB2312-80字库
从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩翰文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有 3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。1980年颁布了《信息交换用汉字编码字符集--基本集》的国标交换码,国家标准号为:GB2312-80,选入了 6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。
(二)大字符集字库(又叫GBK字库)
国际标准化组织为了将世界各民族的文字进行统一编码,制定了UCS标准。根据这一标准,中、日、韩三国共同制定了《CJK统一汉字编码字符集》,其国际标准号为:ISO/IEC10646,国家标准号为:GB13000-90,该汉字编码字符集就是通常人们所说的大字符集,它编入了20902个汉字,收集了大陆一二级字库中的简体字,台湾《通用汉字标准交换码》中的繁体字,58个香港特别用字和92个延边地区朝鲜族“吏读”字,甚至涵盖了日文与韩文中的通用汉字,满足了方方面面的需要。Windows95/98/NT/2000中都装入了大字符集汉字库,人们一般称它为GBK字库。有了GBK字库,还要有对应的汉字输入法,才能输入其中的全部汉字,如果某种汉字输入法仅编入了一二级字库,仍然只能输入6763个汉字。
(三)台湾 BIG5 字库
港澳台地区普遍使用台湾的《通用汉字标准交换码》,地区标准号为:CNS11643,选入了13 000多个繁体汉字,这就是人们讲的BIG5码,或叫大五码。 钱码的“海外繁体版”编入了BIG5字库,能输入13 000多个繁体汉字。
四)新标准汉字库 (GB18030-2000)
2000年3月,国家信息产业部和质量技术监督局在北京联合发布了两项新标准,一项叫做《信息技术和信息交换用汉字编码字符集、基本集的扩充》,国家标准号为:GB18030-2000,收录了27533个汉字,还收录了藏、蒙、维等主要少数民族的文字,以期一举解决邮政、户政、金融、地理信息系统等生僻汉字与主要少数民族语言的输入,该标准于2000年12月31日强制执行;另一项是《信息技术和数字键盘汉字输入通用要求》,国家标准号是: GB/T18031-2000,为数字键盘输入提供了统一的标准。 新标准汉字库已经公布,迫切需要与之相应的输入方法。
(五)方正超大字符集
方正超大字符集字体包括了上面提到的全部汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。这是目前包含字数最全的字库。要安装该字库需在安装WinXP时采用自定义安装,选择安装宋体-方正超大字符集,但是一般的输入法是无法打出这么多的字的,但可以用“插入”—“符号”的方法选择插入。