二分法解析汉字.doc

上传人:ni****g 文档编号:560612083 上传时间:2023-09-02 格式:DOC 页数:4 大小:77.51KB
返回 下载 相关 举报
二分法解析汉字.doc_第1页
第1页 / 共4页
二分法解析汉字.doc_第2页
第2页 / 共4页
二分法解析汉字.doc_第3页
第3页 / 共4页
二分法解析汉字.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《二分法解析汉字.doc》由会员分享,可在线阅读,更多相关《二分法解析汉字.doc(4页珍藏版)》请在金锄头文库上搜索。

1、二分法解析汉字与汉字信息处理 曹万杰(河南省三门峡金茂有限公司)杨春红(河南省公路局筑路机械厂)摘 要:汉字结构复杂,构字规律性差,给汉字的信息处理带来了非常大的困难,本文主要探讨一种汉字的分类和汉字的拆分方法,这种方法是基于大于哲学上的一分为二原理,将汉字分为独体字和组合字两大类,然后不管组合字的结构有多么复杂,都将其看成是由两部分组成,这样可以使我们对汉字的认识更加清晰,有助于汉字的信息化处理。关键词:汉字 二分法 解析 信息处理汉字结构复杂,构字规律性差,难学、难记,是汉字的最大的缺点,随着计算机的诞生,汉字的计算机处理,更加凸显了汉字的这一缺点,这给汉字的信息处理带来了非常大的困难,为

2、了汉字的计算机处理,许多人都在绞尽脑汁寻找最佳方案,但迄今为止,还没有说是哪种最好,有些汉字输入法把汉字进行无规律地拆分,对汉字造成一些不良影响,究其原因就在于,汉字的构字规律性差,种类繁多,难以用一个规则涵盖,本文主要探讨一种汉字的分类和汉字的拆分方法,希望对汉字的信息化处理有所帮助。翻开新华字典,例如一些单体字:“伍”、“俺”、“偶”、“僧”、“僻”、“住”、“亻”字边儿,都与人的外在形态有关;字典中“亻”字边儿的字约320多。带“木”部的字又都和树有种种关系。一方面是种种树木:杨树、榆树、果树、梨树、松柏、杉树、槐树另一方面除这“木”边儿字与地球上许许多多类树有关外,还与树上的各种部件有

3、关:“根”、“梢”、“枝”、“条”、“杈”以及用木头搭起的各种家具或工具:“杠”、“杖”、“枰”、“栏”、“床”、“柜”、“枷”、“架”、“栖”、“档”、“桌”、“椅”、“桨”、“桶”、“棂”、“棺”、“棒”、“棚”、“榻”、“橛”、“檐”一个“木”字把所有的木东西囊括无余;字典里的“木”部字200多个。凡此种种,在此就不一一罗列了。由此本文作者受到启发,产生了用二分法解析汉字的想法,下面就谈一谈这种方法,与读者探讨。从哲学的角度来看,任何事物都是一分为二的,如阴阳、正负、天地、开关,那么对于汉字从结构上来讲也可以将其一分为二,这就是所谓的二分法解析汉字,下面谈一谈二分法解析汉字的原理和方法。

4、一、首先将汉字分为独体字和组合字两大类1、独体字一般来讲独体字就是不能拆分的字,是一个整体,如:串、子、生、夕,人、儿、王。这类字一般不能拆分,或者说,如果将其强行拆分地话,其中至少有一部分只能是一个笔画,如:“人”字、“儿”字、“王”字。另外国家有关标准还特别规定: 交重不拆,极少数不影响结构和笔数的笔画搭挂可拆。例如:“串”字(交重)不可拆分为“中”、“中”; “东”字(交重)不可拆分为“七”、“小”。 拆开后的各部分均为非字部件或均不再构成其他汉字的,即使是相离或相接,也不拆分,视为独体字。例如:“隶”字不可拆分为“”、“”;“非”字不可拆分为“ ”、“”;“竹”字不可拆分为“”、“”。

5、2、组合字由两个或两个以上的独立单元组成的汉字,这类字称为组合字。组合字可分为上下结构、左右结构、包围结构。上下结构如下图所示:把 彬 数 搕左右结构如下图所示:字 算 苑 然包围结构又可分为:半包围结构和全包围结构两大类。 半包围结构如下图所示:周 凶 区 达 载 孝 全包围结构如下图所示:因 国从以上结构图上看,汉字的拆分似乎比较容易,但实际上有些情况下,并不那么容易区分。 例如:“彬” 字可分为“林”和“彡”,还可分为 “木” 和“杉”,还可分为“木”、 “木”和“ 彡”; “总” 字可分为“丷”、“ 口” 和“ 心”和,还可分为和心,还可分为“丷”和“”;“章” 字可分为“立” 和“早

6、”,还可分为“立” 、“ 曰” 和“ 十”,还可分为“音”和“十”;“量” 字可分为“曰”、 “一”和“里”,还可分为 “旦” 和“里”,还可分为“曰”和“”。 另外还有“恭、茶、索、鬼、章、意、总、纂、彬”等字,这样一个字有几种拆分方法,往往容易造成混乱。而在五笔字型输入法中又有不同的拆分方法,例如: “量” 字拆可分为“日”、“一”、“日”、“土”;“拾” 字拆可分为“扌”、“人”、“一”、“口”;“容” 字拆可分为“宀”、“八”、“人”、“口”。二、下面谈一谈二分法解析汉字的规则1、在如下图所示的汉字结构中,将阴影部分作为一部分,其他部分作为一部分。例如:“分”字可分为“八”、“刀”两部

7、分; “相”字可分为“木”、“目”两部分;“想”字可分为“相”、“心”两部分;“骥”字可分为“马”、“冀”两部分。2、分成两部分后,两部分都能单独成为一个汉字,则以两部分都能单独成为一个汉字为原则,每一个汉字作为一部分。例如:“量”字可分为“旦”和“里”两部分,而不拆分为“日”和“”;“彬” 字可分为“木”和“杉”两部分,而不拆分为“林”和“彡”。“摩” 字可分为“麻”和“手”两部分。3、分成两部分后,一部分是一个汉字,而另一部分则不是一个汉字,将成为一个汉字的作为一部分,剩下的作为一部分。例如:“总”字可分为“”和“心”两部分;“其”字可分为“”和“八”两部分;“做”字可分为“亻”和“故”两

8、部分。4、包围部分作为一部分和被包围部分作为一部分例如:“包”字可分为“勹”和“巳”两部分;“习”字可分为“”和“”两部分;“席”字可分为“广”和“”两部分;“圈”字可分为“囗”和“卷”两部分;但“摩”字则分为“麻”和“手”两部分。5、根据国家有关标准,因为构字造成独体字部件相离的,拆分后仍将相离部分合一,保留独体字的原形。例如: “裹”字分为“衣”、“果” 两部分,而不拆分为“亠”、“果”、“”; “乘”字分为“禾”、“北” 两部分,而不拆分为“禾”、“”、“匕”。6、分成两部分后每一部分都不成字时按独体字处理三、二分法解析汉字在汉字编码中的应用举例汉字的结构理顺清楚以后,汉字编码就比较容易

9、了,例如:手机笔画输入法就可以定义为,取第一部分的前两个笔画和第二部分的前两个笔画以及最后一个笔画,或者取第一部分的前三个笔画和第二部分的前两个笔画以及最后一个笔画,再如模拟手写输入法中对于组合字的取码规则为取第一部分的前两个笔画和第二部分的第一个笔画以及最后一个笔画。例如; 四、结束语汉语的优点很多,比如,其形象的审美、单位面积的大信息涵盖量;再比如,填词的便捷性、诗歌语用的灵活性、随意性,有人不时声称,二十一世纪将是汉语的世纪,尽管有人预言,在不久的未来,一个崭新的轴心时代将会在东方形成,汉语将会在世界跨文化的传通中发挥着无穷的威力,但是,如果汉字在信息化处理方面不能找到有效的方法,汉语将处于某种危险之中。因此希望更多的人从事汉字的信息化处理工作,使汉字在信息化时代更加辉煌。通信地址:郑州市黄河路5号附2号中亨商务316室收信人:曹万杰

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号