返回

重码汉字与补加末笔识别码_补码规则第1节

发布于2013-08-08点击数:15696

  ◆ 第四节 补码规则

  一、重码汉字与重码率

  当几个汉字的编码相同时,则这几个字被称作“重码汉字”。

  在整个编码中重码汉字与所有入编汉字的字数之比,称作该编码的“重码率”。“重码率”低,就意味着汉字输入的便捷、快速,这是我们所追求的。

  下面举些“够根汉字”及“一根汉字”重码的字例,因为这两类汉字皆无须加识别码。这样做,既能对重码的情况先有个了解,又能复习“编码规则”及“取码规则”。

  1.够根汉字重码的举例

  (1)多根汉字重码的举例

  “锤”字取码即为编码:“钅丿一土”(qtgf),舍去的第4码是:“艹”(a);

  “锺”字取码即为编码:“钅丿一土”(qtgf),舍去的第4码是:“曰”(j)。

  (2)四根汉字重码的举例

  “凭”字取码即为编码:“亻丿士几”(wtfm);

  “赁”字取码即为编码:“亻丿士贝”(wtfm)。

  2.一根汉字重码的举例

  在一根汉字中,25个键名汉字与5个单笔画汉字是没有重码的,只有字根汉字(加附)  有重码,举例如下:

  (1)字根汉字重码的举例

  “雨”字,“单敲根”+“敲笔”即为编码:fghy;

  “寸”字,“单敲根”+“敲笔”即为编码:fghy。

  (2)字根部首重码的举例

  “卩”字,“单敲根”+“敲笔”即为编码:bnh;

  “阝”字,“单敲根”+“敲笔”即为编码:bnh;

  “凵”字,“单敲根”+“敲笔”即为编码:bnh。

  二、为何要补加末笔识别码

  1.加末笔识别码的作用

  “少根汉字”(三根汉字、二根汉字)的输入皆需补加末笔识别码。为何要多此一举呢?这是五笔字型编码为降低汉字编码的重码率而采取的一项措施。

  那么为何补加末笔识别码后就能降低汉字编码的重码率呢?这是因为:

  (1)少根汉字依字根而编的码,其编码字母数不足四个,允许在其末尾补加一码。

  (2)少根汉字依字根而编的编码虽然相同,它们的末笔画不一定相同;即使末笔画相同,它们的字型不一定相同。补加末笔识别码就有可能使原先有重码的汉字不会重码。

  比如说,有两个人叫“张军”,“张军”两字“不可能”把这两个人区分开来;但如果在“张军”后面加上个性别,变成“张军(男)”与“张军(女)”,这样就“有可能”把这两个人区分开来。“有可能”比“不可能”要好一些,这就是要补加末笔识别码的道理。

  2.举字例说明

  (1)三根汉字的字例

  “甙”字的取码为:“弋艹二”(aaf);

  “苷”字的取码为:“艹艹二”(aaf)。

  “甙”与“苷”依字根而取的三码是重码,且末笔画也相同 —?— 都是“横”。但它们的字型不相同,“甙”是杂合型字,“苷”是上下型字(关于字型类别下面就讲到)。

  将杂合型的“横”定为第3种“横”,其识别码为“d”,

  将上下型的“横”定为第2种“横”,其识别码为“f”,

  于是:“甙”字的编码为:aafd,而“苷”字的编码为:aaff;

  这样一来这两个汉字就不会重码了。

  (2)二根汉字的字例

  “茸”字的取码为:“艹耳”(ab);

  “邛”字的取码为:“工阝”(ab)。

  “茸”与“邛”依字根而取的二码是重码。但“茸”字末笔画是“横”,而“邛”字末笔画是“竖”。它们的字型也不相同,“茸”是上下型字,“邛”是左右型字。

  将上下型的“横”定为第2种“横”,其识别码为“f”;

  将左右型的“竖”定为第1种“竖”,其识别码为“h”。

  于是:“茸”字的编码为:abf,而“邛”字的编码为:abh;

  这样一来这两个汉字就不会重码了。

关注我们: 粤ICP备13015957号-4 © 2013-2015 Kingsoft Corp
2014“净网行动”网络服务注意事项

关闭