基于GB18030编码标准的中文Linux系统
【摘要】:随着Linux在我国和世界范围内的飞速发展,Linux处理汉字的能力也在不
断提高。不过由于Linux是基于位的操作系统,至今为止还没有一个能够处理
四字节长度字符的Linux操作系统。中国政府于2000年3月17日颁布的
GB18030-2000编码标准采用了单字节、二字节和四字节字符混合的方式进行汉
字编码,并且要求操作系统必须在2001年9月份之前遵守这个标准,也就是说
必须能够处理四字节长度字符。
本文在现有Linux系统的基础上,提出基于GB18030编码标准字符集的中
文Linux操作系统的实现框架,把实现分为核心支持系统、基本支持系统和完
全支持系统,同时实现了核心支持系统的所有功能和基本支持系统的绝大多数
功能。使得Linux系统能够正确识别和转换GB18030编码标准字符集中的字符,
同时不管在字符界面还是图形界面下,都能够正确输入和显示GB18030编码标
准字符。
本文介绍了基于GB18030编码标准字符集的中文Linux操作系统的设计和
实现,从而使得Linux能够正确识别和处理二四字节混合的汉字编码。这项工
作不仅在国内,而且在国际上也是首次实现,它也可以作为下一步实现少数民
族语言信息化工作的基础。