首页> 中文期刊> 《中文信息学报》 >编码字符集中子集的完整性

编码字符集中子集的完整性

         

摘要

本文提出编码字符集中的完整性问题。(一)中给出两类编码实例。一类严格遵从“一个字符只分配给一个码位“或”任何字符都不重复分配码位”(简称一符一码)的节约原则。另一类以一符两码可多码的方式,以码位的牺牲换取子集的完整性。(二)中解释了子集完整性概念和意义。说明了有意义的子集通常是现实中某子系统的反映。多文种编码字符集的许多子集往往与某自然语言系统相关联,这种子集的完整性,也就与相应语言文字的系统性相关联。据此提出了完整性条件,此较了完整性得失,说明了完整性的某种相对性。(三)中指出不少字符集,含ISO 10646 DP版及DIS版,的一符一码原则损害了若干子集的完整性。在那里,拉丁文字圈中除英文以外的各国家、各民族的文字字符子集大多被肢解了,只有字母表是英文字母表(含元素2×26=52个)子集者例外。斯拉夫文字圈、阿拉伯文字圈情况相似。文中指出汉语拼音字母子集,无论在汉字编码的中国国家标准中还是国际标准10646中被严重肢解了。 本文是作者另文《字符集的序性》[9]的续编。本文的讨论仍除外汉文及藏文。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号