组合式音形义汉字编码输入法的制作方法

上传人:ting****789 文档编号:310043505 上传时间:2022-06-14 格式:DOCX 页数:10 大小:28.03KB
返回 下载 相关 举报
组合式音形义汉字编码输入法的制作方法_第1页
第1页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《组合式音形义汉字编码输入法的制作方法》由会员分享,可在线阅读,更多相关《组合式音形义汉字编码输入法的制作方法(10页珍藏版)》请在金锄头文库上搜索。

1、组合式音形义汉字编码输入法的制作方法专利名称:组合式音形义汉字编码输入法的制作方法技术领域:本发明属于用于计算机或其他对汉字字符信息进行处理装置的汉字编码输入方法。背景技术: 本发明是对本申请人在此前提出的申请号为03112606.5发明专利技术申请案的一个实施方案。发明目的本发明的目的是提出实施03112606.5号专利申请案的一类更适用于以词语输入为主的汉字编码输入的具体实施方案。发明内容本发明的计算机使用的组合式音形义汉字编码输入法,利用计算机通过字母键盘或者手机、计算机的数字键盘,输入汉字或词语,具体的实现步骤如下一、根据主形编码部件的含义归并设定25类编码部件字母型义类码,具体如下所

2、示二、设定编码部件字母型代码、编码部件字母型义类码根据GF3001规范要求,选取编码部件。选定的编码部件根据义相同或形相近等明显关联性,归并成编码部件组,并从每个编码部件组中选定一个主形编码部件作代表,每个编码部件赋予与其编码部件组的主形编码部件完成相同的编码部件字母型代码和编码部件字母型义类码。为了更好适用于以词语输入为主的现代汉语文字的计算机或其他对汉字字符信息进行处理、存储、传输、显现、输入和输出装置的汉字输入,本发明对编码部件的设置和编码部件的字母型代码和字母型义类码的设置等又进行了一些新的设定。对于不是以汉语拼音首字母作编码部件字母型代码的有构词能力的成字编码部件,都再增设一个以其汉

3、语拼音首字母作代码的编码部件字母型代码;还把一些非拼音首字母的成字编码部件的字母型全码改成拼音首字母的编码部件字母型全码;还对部分非成字编码部件以其与另一个编码部件组成的一个汉字增设为该编码部件组的主形编码部件;还调整、增加了一些编码部件;还对一些有两种字义和两种读音的编码部件增加了只作表达其成字编码部件的拼音首字母编码部件字母型全码,具体有“一”字母型全码为“YN”;“月”字母型全码为“YO”;“孑”字母型全码为“JC”;“行”字母型全码为“HF”。本汉字编码输入法设定的404个编码部件组中702个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于对照表404个编码部件组、702个

4、编码部件的编码部件字母型代码、编码部件字母型义类码对照表)。为了叙述方便,把那些具有两种编码部件字母型代码的一类编码部件称之为双代码编码部件,只有一种编码部件字母型代码的一类编码部件称之为单代码编码部件;又把双代码编码部件中把以拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件拼音首字母字母型代码,简称首音字母型代码;把以非拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件非拼音首字母字母型代码,简称非首音字母型代码。那些单代码编码部件中除一些没有独立构词能力的编码部件以外,都是以拼音首字母作编码部件代码。在编码部件的设定方面,当然还可以再增加一些或再减少一

5、些编码部件,这只对编码输入法的重码率、重码字词键选率等技术指标产生一些影响,但对整个汉字编码输入法不构成根本性影响。根据对照表的每个编码部件的字母型代码,把它分配设置在计算机通用字母键盘相应的字母键位上;同样根据上述对照表的每个编码部件的字母型义类码,把它分配设置在计算机通用键盘的相应的字母键上。这样,每个字母键位上,设置了具有相同字母型代码的编码部件集合和具有相同字母型义类码的另一个编码部件集合,这字母键的字母也就成为这些编码部件的字母型代码,同样也成为那些编码部件的字母型义类码。三、设定27个含有构字能力特别强的主形编码部件的组为高频编码部件组,确定其组内的各个高频编码部件共计35个,高频

6、编码部件在汉字结构中的主部位位置,具体见附图127个高频编码部件组的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、取码提示及其主部件位置对照表。四、设定字母码、编码部件字母型代码、字母型义类码转换成数字码、数字型代码、数字型义类码的方式,以及设定编码部件数字型全码为了在计算机数字键盘或者手机数字键上实现组合式音形义数字型汉字编码输入,把字母码及每个编码部件字母型代码、字母型义类码,根据GB/T18031-2000信息技术数字键盘汉字输入通用要求以如下两种方式转换成数字码及相应的数字型代码、数字型义类码第一种转换法,10键位法以1个数字码替换相应

7、的几个字母码,具体为以1替换a、b、c;以2替换d、e、f;以3替换g、h、i;以4替换j、k;以5替换l、m;以6替换n、p;以7替换o、q、r;以8替换s、t、u;以9替换w、x;以0替换y、z。从而得到编码部件相应的数字型代码、数字型义类码以及拼音首字母的字母码转换成的数字码。对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码及其编码部件义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,对于“广”、“女”、“石”三个编码部件组的编码部件不以上述方式转换,而定义其编码部件数字型代码加上数字型义类码分别为33、66、74;对于五类汉字笔画也不以上述方式转换,而定义为“一”

8、横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为7。第二种转换法,8键位法以1个数字码替换相应的几个字母码,具体为以2替换a、b、c;以3替换d、e、f;以4替换g、h、i;以5替换j、k、l;以6替换m、n、o;以7替换p、q、r、s;以8替换t、u;以9替换w、x、y、z;从而得到编码部件相应的数字型代码、数字型义类码;对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码、字母型义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,定义“言”、“广”、“月

9、”、“石”、“木”、“心”编码部件组,其数字型代码加上数字型义类码分别为46、44、96、74、89、94。对于五类汉字笔画,也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为6。为了降低重码率,每个编码部件的数字型全码定义为编码部件数字型代码+编码部件数字型义类码+编码部件的首笔画或者末笔画的部件数字型代码。由于所取笔画前后位置不同,每个编码部件能得到两类数字型全码,一种称为首笔画数字型全码,另一种称为末笔画数字型全码,相应能设计成两类数字

10、型汉字编码输入法。为了便于叙述,规定对某编码部件取3码,就是依次取其数字型全码;取2码,就是依次取其数字型代码和数字型义类码;取1码,就是取其数字型代码。对于高频编码部件首笔画数字型全码如附图227个高频编码部件的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、10键位首笔数字型全码、8键位首笔数字型全码,取码提示及其主部件位置对照表中所示。五、组合式音形义汉字编码输入法利用上述方法形成的字母型汉字编码资源可以实现组合式音形义汉字的字母型编码输入,利用上述方法形成的数字型汉字编码资源可以实现组合式音形义汉字的数字型编码输入。组合式音形义汉字编码输

11、入法由组合式音形义字母型汉字编码输入法和组合式音形义数字型字编码输入法两部分组成,既可以在同一台计算机上切换调用,也可以分别在两台计算机上单独使用;也可在其他处理汉字字符信息的装置上使用。第一部分组合式音形义字母型汉字编码输入法为了实现现代汉语以词语输入为主的需要,同时解决使用者对不知道读音的汉字的输入,本发明对汉字字符集中的每个汉字赋予拼音首字母音形义字母型汉字编码和非拼音首字母音形义字母型汉字编码的两套编码,或者对那些能知读音的常用汉字赋予拼音首字母音形义字母型汉字编码,对于整个汉字字符集用非拼音首字母音形义字母型汉字编码方法赋予编码,这样可以适当降低汉字编码输入的重码率。用拼音首字母音形

12、义字母型汉字编码实现汉字、词语的编码输入,用非拼音首字母的音形义字母型汉字编码实现使用者不知道读音的汉字的编码输入。为此,称之为组合式音形义字母型汉字编码输入法。上述两种编码可以编制在同一张码表中,这样重码率会提高,但使用时不需要切换;也可以分别编制在两张码表中,切换调用;当然也可以只设置拼音首字母音形义字母型汉字编码码表,采用拼音首字母音形义字母型汉字编码方法实现汉字的编码输入,遇到不知道读音的汉字,用疑问键代替拼音首字母,在显示窗中显示后,再用选择键选择;或者只设置非拼音首字母音形义字母型汉字编码码表,采用非拼音首字母音形义字母型汉字编码方法实现汉字的编码输入。对设定采用的汉字字符集(如G

13、B2312汉字字符集,或GB18030的汉字字符集,或方正兰亭的64447个汉字字符集)中的每个汉字及其现代汉语词语,根据所述的字母型汉字编码方法确定的编码,编制码表,利用汉字编码输入软件,把通过计算机字母键盘上输入的汉字、词语的外码,通过应用程序,从字库里调出相应的汉字的内码,进行显示、打印等操作。下面就组成组合式音形义字母型汉字编码输入法的两类汉字编码方法提出技术方案,在实际使用中只要在这两类汉字编码方法中各选择一种编码方法,组合在一起组成组合式音形义字母型汉字编码输入法;当然也可以只选择上述两类方法中的一种,完成汉字的编码输入。两类汉字编码技术方案分述如下(一)拼音首字母音形义字母型汉字

14、编码方法设定码长为4,输入时,击4个编码字母键,如有重码字、词出现,再击选择键选择。对于码长不足4的汉字编码,以结束键结束,如有重码,再用选择键选择。为了区分字和词语,结束键可以分别设置,如用空格键作词语的结束键,Enter键作字的结束键,或者用Enter键作词语的结束键,空格键作字的结束键。在大小写字母的确定上,可以用小写字母给简体汉字编码,用大写字母给繁体汉字编码,或者相反设定,可以用小写字母给繁体汉字编码,用大写字母给简体汉字编码。利用字母编码资源,实现编码输入。为了减少击键次数,也可以选择一些常用的汉字,根据其拼音首字母音形义字母型汉字编码的第1、第2、第3的编码字母码设置出一批1码、

15、2码、3码的简码,用结束键结束,选择键确定要输入的汉字。由于本发明提出了让部分编码部件有两种字母型代码的技术方案,这样对于部分单个编码部件或者对于2个或者2个以上编码部件组成的汉字取编码时,又有两种方法。一种方法,在汉字编码部件输入时对于双代码编码部件,采用双代码编码部件拼音首字母字母型全码;在对2个或者2个以上编码部件组成的汉字取编码时,涉及到双代码编码部件取码时采用双代码编码部件非拼音首字母字母型代码、字母型义类码,故称之为拼音首字母混合式音形义字母型汉字编码。另一种方法,在成字编码部件输入时,对于双代码编码部件,仍然采用双代码编码部件拼音首字母字母型全码;在对由2个或者2个以上编码部件组

16、成的汉字取编码时,涉及到双代码编码部件取码时,采用双代码编码部件拼音首字母字母型代码、字母型义类码,故称之为拼音首字母单一式音形义字母型汉字编码。这两种方法的编码都能实现汉字编码输入,比较而言,后者,思维上比较顺畅一些,但由于减少了参与编码的字母型代码数量,相对而言,重码率会提高。具体取码的技术方案分述如下A.4码法拼音首字母混合式音形义首部余部字母型汉字编码方法成字编码部件的编码对于双代码编码部件,依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单全码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码。对于2个或者2个以上编码部件组成的汉字,取编码时,涉及到双代码编码部件取码时,采用双代码编码部件非拼音字母字母型代码、字母型义类码;首编码部件为高频编码部件的合体汉字其取码技术方案为对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件字母型代码、第2编码部件字母型代码、第

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号