简易五笔汉字编码方法及其键盘的制作方法

上传人:ting****789 文档编号:310042768 上传时间:2022-06-14 格式:DOCX 页数:12 大小:28.41KB
返回 下载 相关 举报
简易五笔汉字编码方法及其键盘的制作方法_第1页
第1页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《简易五笔汉字编码方法及其键盘的制作方法》由会员分享,可在线阅读,更多相关《简易五笔汉字编码方法及其键盘的制作方法(12页珍藏版)》请在金锄头文库上搜索。

1、简易五笔汉字编码方法及其键盘的制作方法专利名称:简易五笔汉字编码方法及其键盘的制作方法技术领域:本发明涉及中文信息处理和汉字编码技术领域。汉字的计算机输入编码方案,迄今已有几百种之多。这几百种编码方案,大致可分为音码、形码和音形码三类。由选取的部首和笔划的不同,形成了各种各样的汉字拆分形码和音形码编码方案。众多的形码和音形码编码方案,按汉字编码码长区分,可分为四码编码方案和三码编码方案两类。四码编码方案中,汉字和词汇都以同样的四码编码。初看起来,四码编码容量大,汉字重码率低。但由于中文输入包括汉字输入和词汇输入,当词汇容量增大时,汉字和词汇的重码率急剧上升。在一些四码编码方案中,为保持较低的汉

2、字和词汇的重码率,不得不限制词汇容量。三码编码方案中,基本上采用汉字以三码编码,词汇以四码编码方式。以这种编码方式,汉字编码空间和词汇编码空间相互独立,词汇的容量并不影响汉字的重码率。但由于汉字仅以三码编码,其编码容量较小。以26个英文字母键为编码键位,采用三码编码,其编码容量为17576个编码。仅为GB2312-80中6763个汉字的2.6倍。以这样小的编码空间比,不论怎样选取编码码元,势必导致较高的汉字重码率。另一方面,虽然汉字以三码编码,为要与词汇输入一致,在输入一个汉字时,需要输入一个空格键。因此,输入一个汉字,仍然需要输入四个键。大多数形码和音形码编码方案,为降低汉字重码率,采用了较

3、多的编码码元,如近百个或上百个字根。太多的编码码元,映射排列到编码键盘上,必然显得繁杂,难以做到有规律可寻,给该编码方法的学习和使用造成了很大的困难。因此,在保持适度的汉字低重码率的基础上,减少编码码元,兼顾易学易用和高输入效率,是一个好的汉字编码方案要达到的目标。这也是本发明提出的简易五笔汉字编码方法所要达到的目标。本发明是这样实现的创造性地提出常规编码码元和特殊编码码元编码原理,根据此原理,字词编码兼容统一,而汉字和词汇又能分别具有各自独立的编码空间。因此,一方面降低了词汇的重码率,另一方面,当词汇容量增大时,并不影响汉字的重码率。在常规编码码元中,提出了派生类编码码元。在特殊编码码元中,

4、提出了单笔划类和排列序号类编码码元。采用很少的30多个基本常规编码码元和一些特殊编码码元,对汉字和词汇依形编码,或增加字音类常规编码码元,对汉字和词汇依音形编码。编码码元在键盘上布置合理,规律性强。此编码方法的特征是规定了常规编码码元和特殊编码码元,设计了相应的编码键盘,提出了基于常规编码码元和特殊编码码元的编码原理,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,可形成多种编码方案及其相应的编码键盘。定义26个英文字母键为常规编码键位,并且定义一些符号键为特殊编码键位,分别映射常规编码码元和特殊编码码元,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,选用相应的编码键

5、位,映射选用的编码码元,可形成多种编码方案及其相应的编码键盘。基于此编码方法,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,可形成多种编码方案及其相应的编码键盘(1)或者是依形编码方案A,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类和排列序号类特殊编码码元,基于四类编码码元,即部首类码元、笔划类码元、派生类码元和序号类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依形编码,(2)或者是依形编码方案B,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类特殊编码码元,基于三类编码码元,即部首

6、类码元、笔划类码元和派生类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依形编码,(3)或者是依形编码方案C,规定了单笔划类特殊编码码元,基于两类编码码元,即部首类码元和笔划类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依形编码,(4)或者是依形编码方案D,基于两类常规编码码元,即部首类码元和笔划类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依形编码,(5)或者是依音形编码方案A,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类和排列序号类特殊编码码元,基于五类编码码元,即字音类码元、部首类码元、笔划类码元、派生类码元和序号类码元,和

7、相应的编码键盘的汉字编码规则,对汉字和词汇依音形编码,(6)或者是依音形编码方案B,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类特殊编码码元,基于四类编码码元,即字音类码元、部首类码元、笔划类码元、和派生类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依音形编码,(7)或者是依音形编码方案C,规定了单笔划类特殊编码码元,基于三类编码码元,即字音类码元、部首类码元、和笔划类码元,和相应的编码键盘的汉字编码规则,对汉字和词汇依音形编码,(8)或者是依音形编码方案D,基于三类常规编码码元,即字音类码元、部首类码元、和笔划类码元,和相应的编码键盘的汉

8、字编码规则,对汉字和词汇依音形编码。基于此编码方法,可以形成对汉字和词汇以数字编码,采用编码数字键盘输入汉字和词汇的方法,即一种数字Chinese Keyed Entry简称数字“CKE”编码方法。此数字“CKE”编码方法的特征是规定了常规编码码元和特殊编码码元,设计了相应的编码数字键盘,提出了基于常规编码码元和特殊编码码元的编码原理,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,可形成多种编码方案及其相应的编码数字键盘。此数字“CKE”编码方法定义1到6或1到9的数字键的两键组合中的一部分为常规编码组合键位,一部分不用或可选为特殊编码组合键位,定义1到9的数字键单键为特殊编码单

9、键位,分别映射常规编码码元和特殊编码码元,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,选用相应的编码数字键位,映射选用的编码码元,可形成多种数字编码方案及其相应的编码数字键盘。基于此数字“CKE”编码方法,根据全部或部分是否选用特殊编码码元、派生类码元和序号类码元,可形成多种数字编码方案及其相应的编码数字键盘(1)或者是依形数字编码方案A,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类和排列序号类特殊编码码元,基于四类编码码元,即部首类码元、笔划类码元、派生类码元和序号类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依形编码

10、,(2)或者是依形数字编码方案B,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类特殊编码码元,基于三类编码码元,即部首类码元、笔划类码元和派生类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依形编码,(3)或者是依形数字编码方案C,规定了单笔划类特殊编码码元,基于两类编码码元,即部首类码元和笔划类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依形编码,(4)或者是依形数字编码方案D,基于两类常规编码码元,即部首类码元和笔划类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依形编码,(5)或者是依音形数字编码方案A,在由部首类和

11、笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类和排列序号类特殊编码码元,基于五类编码码元,即字音类码元、部首类码元、笔划类码元、派生类码元和序号类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依音形编码,(6)或者是依音形数字编码方案B,在由部首类和笔划组合类编码码元组成的常规编码码元中,规定了派生类编码码元,以及规定了单笔划类特殊编码码元,基于四类编码码元,即字音类码元、部首类码元、笔划类码元、和派生类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依音形编码,(7)或者是依音形数字编码方案C,规定了单笔划类特殊编码码元,基于三类编码码元,即字

12、音类码元、部首类码元、和笔划类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依音形编码,(8)或者是依音形数字编码方案D,基于三类常规编码码元,即字音类码元、部首类码元、和笔划类码元,和相应的编码数字键盘的汉字编码规则,对汉字和词汇依音形编码。在本发明提出的简易五笔汉字编码方法的各种依形编码方案和依音形编码方案中,字词最大编码码长可以选择为四码。为了减少大词汇量的重码率或用于GBK大字符集汉字输入,字词最大编码码长也可以选择为五码。可以选择(1)或者是字词4-4码编码方式,即汉字和词汇的最大编码码长均为四码。(2)或者是字词4-5码编码方式,即汉字和词汇的最大编码码长各为四码和五码。(

13、3)或者是字词5-5码编码方式,即汉字和词汇的最大编码码长均为五码。在本发明提出的简易五笔汉字数字“CKE”编码方法的各种依形数字编码方案和依音形数字编码方案中,对应上述字词4-4码编码方式,汉字和词汇的最大数字编码位数均为八位,对应上述字词4-5码编码方式,汉字和词汇的最大数字编码位数各为八位和十位,对应上述字词5-5码编码方式,汉字和词汇的最大数字编码位数均为十位。在上述字词统一编码方式中,汉字的数字编码的最后位为结束码0,对应数字键0。若仅输入汉字,对应上述汉字4码编码方式,汉字的最大数字编码位数为七位,对应上述汉字5码编码方式,汉字的最大数字编码位数为九位。若汉字的数字编码位数小于最大

14、数字编码位数,则补一个结束码0。较之其它各种汉字编码方案,简易五笔汉字编码方法具有如下几个重要的特点和优点1基本编码码元少。仅有9个部首类码元、1个三笔划类码元、25个两笔划类码元和5个单笔划类码元,即,在依形编码时,最多仅有40个基本编码码元。在依音形编码时,仅增加23个或26个字音类码元。2派生类码元基于基本常规编码码元,在编码和键位上与基本常规编码码元一致,易于掌握和熟悉。3规定了单笔划类和排列序号类特殊编码码元。一方面,较之一般的三码编码方法,大大地扩展了汉字编码容量,增强了汉字间的区分能力。其编码容量大致估计,大约为26*31*31*7=174920个编码,约为三码编码方法的编码容量

15、的10倍。另一方面,较之一般的四码编码方法,虽然汉字编码容量要小一些,但词汇编码容量等于四码编码方法的编码容量。因此,汉字编码和词汇编码总容量比一般的四码编码方法的编码容量要大很多。并且,由于通过此两类特殊编码码元,将汉字编码空间和词汇编码空间隔离开来,使汉字的重码率和词汇的重码率互不影响。因此,不论词汇容量怎样扩大,始终不会影响汉字的重码率。这样,一方面能够保持汉字的低重码率,另一方面又能降低词汇的重码率。迄今所有其它各种汉字四码编码方法,都未能解决这个问题。对这些汉字四码编码方法来说,汉字和词汇共用一个编码空间。当词汇容量增大时,汉字的重码率急剧上升,若想保持较低的汉字重码率,就只能限制词

16、汇容量。4汉字和词汇均具有较低的重码率,字词综合重码率低。与目前使用较多的形码编码方案“五笔字型”相比,若“五笔字型”不计入词汇,仅汉字而言,二者汉字重码数接近。与依形和依音形编码方案A、B和C相比,“五笔字型”的汉字重码数要略少一些,而依音形编码方案D的汉字重码数,则略少于“五笔字型”。但是,当计入词汇时,本发明的依形和依音形编码方案A、B和C的汉字重码数不论词汇容量怎样扩大,始终保持不变,而“五笔字型”的汉字重码数急剧上升,远远大于前者的汉字重码数。由于本发明的编码规则定义、编码码元选择和相应键盘布置合理,本发明的词汇重码数也远远小于“五笔字型”的词汇重码数,在不同的词汇容量的情况下,仅为“五笔字型”的百分之五十至百分之七十四。考虑到“五笔字型”采用了一百多个字根,其编码码元数远远大于本发明的编码码元数。显而易见,本发明提出的简易五笔汉字编码方法较之“五笔字型”及其它类似的汉字编码方法,在各方面都要优越得多。5简易五笔汉字编码方法既可应用于普通大键盘,也可以转为简易五笔汉字

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号