对方块汉字的新认识

上传人:平*** 文档编号:17050960 上传时间:2017-11-10 格式:DOC 页数:21 大小:115.99KB
返回 下载 相关 举报
对方块汉字的新认识_第1页
第1页 / 共21页
对方块汉字的新认识_第2页
第2页 / 共21页
对方块汉字的新认识_第3页
第3页 / 共21页
对方块汉字的新认识_第4页
第4页 / 共21页
对方块汉字的新认识_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《对方块汉字的新认识》由会员分享,可在线阅读,更多相关《对方块汉字的新认识(21页珍藏版)》请在金锄头文库上搜索。

1、第二章 对方块汉字的新认识第一节 汉字的三个层次第二节 汉字的五种笔划第三节 汉字的三种字型第四节 字根的选取第五节 汉字的结构分析第六节 末笔字型交叉识别第七节 单体结构拆分原则汉字的拆分方块汉字给人的第一印象就是笔划形态多变,字型错综复杂,数量数以万计。在中华民族漫长的历史变革中,汉字的确切数量谁也无从统计。国家标准信息交换用汉字编码字符集(基本集) (GB2312-80)中,有 6763 个汉字。(1)国家标准 GB2312(80)字集 6763 个汉字-(2)台湾 BIG5 字集 -13053 个汉字-(3)简体+繁体 - -15432 个汉字 -(4)大字符集 GBK 字集 -210

2、03 个汉字首先对汉字的结构规律进行深入地研究和分析。第一节 汉字的三个层次笔划、字根、单字汉字起源于象形文字,直到后来,汉字楷化之后,才形成了“笔划” 。所谓“笔划”就是在书写汉字时,不间断地一次连续写成的一个线条。 “笔划”也有人写作“笔画” 。自从接触汉字以来,就意识到,一个完整的汉字,既不是一系列不同的笔划的线性排列,也不是一组组各种笔划的任意堆积。而是由若干笔划复合连接交叉所形成的相对不变的结构,绝大多数都是我们部首查字法的字典中部首的图形,我们把这种图形称作“字根” 。一般地说,字根是有形有义的,在多数情况下也叫做构字基本单位(部件、字元、码元) 。这些基本单位经过拼形组合,就产生

3、出众多的汉字。可见,汉字可以划分为三个层次:即笔划、字根、单字。也就是说,由若干笔划复合连接交叉形成相对不变的结构组成字根;再将字根按一定的位置关系拼合起来就构成了汉字。因此,我们说字根是构成汉字的最重要的单位,字根是汉字的灵魂。“五笔字型”方案的基本出发点之一是遵从人们的习惯书写顺序,以字根为基本单位来组字编码、拼形输入汉字。#第二节 汉字的五种笔划横、竖、撇、捺、折汉字笔划是不间断地一次连续写成的一个线条。对成千上万的汉字及其字根加以分析,只考虑笔划的运笔方向,不计其轻重长短,将汉字的笔划划归为横、竖、撇、捺、折五种。为便于记忆和应用,根据其使用频率的高低,依次用 1、2、3、4、5 作为

4、代号,见下表。 代号 笔划名称 笔划走向 笔划及其变形1 横 左 右 一 2 竖 上 下 丨 3 撇 右上 左下 丿 4 捺 左上 右下 丶 5 折 带转折 乙 从表中可以看出,除基本笔划外,还对汉字的具体形态结构中的笔势变形进行了归类,其理由是:在汉字的具体形态结构中,其基本笔划横、竖、撇、捺、折常因笔势和结构上的匀称关系而产生某些变形,或者一带笔而变成钩(左钩) ,如“丨”变为“ ”等,或走向多了一些转折,变成了“ ”、 “ ”等。另外,一些基本笔划的大小、长短有时也有不一致(如上表中笔划及其变形的第二列) 。但是这些都是次要的方面,其共性在于运笔方向及一笔连续写成都仍然具有基本笔划的形态

5、特征。五种笔划在组成汉字时,笔划间的关系可分为以下四种:1、 单:即五笔划自身;2、 散:组成字根的笔划之间有一定距离,如:“三、八、氵”等;3、 连:组成字根的笔划之间是相连的,如:“厂、人、尸、弓”等;4、 交:组成字根之间的笔划是相互交叉的,如:“十、力、又、车”等。当然还会有混合的情况,即一个汉字的各笔划间,有连又有交或散,例如:“雨” 、 “禾”等。掌握上述笔划间的关系,对非基本字根的拆分和“识别码”的选取是非常有用的。练习1、汉字的笔划分为哪几类?各种笔划是如何归并的?2、把下列汉字按书写顺序拆成单笔划,并分出哪些是散型字根。戋士犬丁早川甲竹手月八儿文文辛米小了刀巴幺门也心一二十寸

6、石西止卜力贝几由夕广弓疒立彡氵第三节 汉字的三种字型研究汉字的字型,是研究由字根构成汉字时,字根之间在汉字中所处的位置关系。成千上万的方块汉字,可以分为三种类型:左右型、上下型、杂合型。按照各种类型拥有汉字的多少从 1 到 3 给以代号,如下表所示。字型代号 字型 字 例1 左右 江 河 北 刘 谁 种2 上下 多 学 花 草 青 看 3 杂合 因 凶 重 乘 天 边 且 表中,杂合型又叫独体字,左右、上下两种类型又称合体字。两部分合在一起的汉字叫双合字,三部分合在一起的汉字叫三合字。一般合体字只分到三合字一级,其原因是“五笔字型”汉字编码方案取四码,由于二、三合体字的字根较少,不足四码(即信

7、息量不足) ,26 个字根排列在一个字键上,离散不开,容易造成重码,所以才有必要补加一个字型信息。而对于由四个部分以上组成或者可以拆分成四个部分的汉字,其信息量已足够,就不必再考虑字型信息了。三种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中字根之间排列的相互位置关系。搞清这一点,对于确定多字根的汉字的类型是十分重要的,下面分别予以说明。一型:左右型汉字在左右型汉字中,包括两种情况:1、 在双合字中,两个部分分列左右,整个汉字中有着明显的界限,字根间有一定的距离,如:“杜、明、现、但、咽、枫”等。 “咽”和“枫”的右边也都是各由两个字根构成,显然这两个字根之间是杂合型关系,但整个汉字属

8、于左右字型。2、 三合字中,整个字的三个部分从左到右排列;或者单独占据一边的部分与另外两部分呈左右排列,如:“侧、别、说”等,都属于左右型。二型:上下型汉字上下型汉字也包括两种情况:1、 双合字中,两个部分分列上下,在整个汉字中有着明显的界限,各部分间有一定的距离,如:“军、节、晋、愚”等。2、 三合字中,三个部分分上下排列,或者占一层的部分与另外两个部分分作上下排列;如:“意、想、花”等。三型:杂合(单体、内外、包围型)汉字三型汉字是指组成整字的各个部分之间没有简单明确的左右或上下关系者。如:“困、周、斗、飞、秉、函、本、丹、戌、边”等。汉字的图形特征,可以用来作为识别汉字的一个重要依据。如

9、说:“口” 、 “巴”左右排列为“吧” ,上下排列为“邑”等。由此,我们还可以把三种字型叫做字根的三种排列方式。在向计算机输入不足四码的汉字时,除了键入组成汉字的字根之外,有时还必须键入字根的排列方式,即补充一个字型信息。练 习1、 汉字分哪几种字型?2、 为以下汉字标出字型代号:扒艾笆备柏泵卞厕叉场床笛讹封挂荤霍剂连疗码美闷票浅肋好声宋圆钏君尔弗竿冈匡缶第四节 字根的选取我们说过,由若干笔划交叉连接而成的相对不变的结构,就叫字根。但是字根并不像汉字那样,有公认的标准和一定的数量。哪些结构算字根,哪些结构不算字根,历来没有严格的界限。不同的研究者,不同的应用目的,其筛选的标准和选定的数量差异很

10、大。例如,我们可以把“里”选作为一个字根,但是,也可以把它拆分为:“曰”和“土” 、 “甲”和“二”等两个字根,也有人把它拆成“田”和“土”两个字根。在汉字拼形编码的研究中,所选字根多数是一些传统的汉字部首。但由于某种需要,有时也选用一些不是部首的笔划结构作为字根,甚至于硬造出一些“字根”来。相反,有些虽然是传统部首,但鉴于它们组字很少或者其本身便于拆分成几个部分,在制定编码方案时也未必选取,例如:在“五笔字型”方案中, “足、鱼、礻、衤、羊、皮、麻、户”都不选作基本字根。在“五笔字型”方案中,我们把那些组字能力很强(组字频度高) ,而且在日常汉语文字中出现次数很多(实用频度高)的字根,称作基

11、本字根。而把所有落选的非基本字根一律按“单体结构拆分原则” ,拆分成彼此交连套迭的几个基本字根。这样,我们就可以说:一切汉字都是由“基本字根”组成的了。这里,把优选出的 125 种基本字根,按照其起笔代号,分为五个大区,再考虑键位设计的需要,每区又分为五个位,命名区号和位号(十位数位为区号,个位数位为位号) ,以 1155 共二十五个代码表示,如五笔字型键位图所示。这样就建立起了“五笔字型”汉字编码方案的字根总表,今后凡是提到字根,一律指的是这 125种基本字根。也就是说,只有这 125 种基本字根才有资格参加编码,其它任何形态的笔划结构,都要全部理解为是由这 125 种基本字根组成的。因此,

12、这 125 种基本字根既是组字的依据,又是拆字的依据,是对任何汉字及词汇编码的“基本构件” 。这 125 种字根中又可分为键名字、笔划和基本字根三种,它们都统称为基本字根。练 习1、五笔字型中是如何优选字根的?2、五笔字型方案的字根总表是如何建立的?3、五笔字型方案中,基本字根的含义是什么?它们是如何分区归位的?4、背诵 25 个键名汉字,并注意它们与英文字母的对应关系。第五节 汉字的结构分析一切汉字都由基本字根拼合而成的,包括许多没有资格入选为基本字根的单体结构,这些单体结构并不一定都是汉字,如:“ 、 ”,也全部是由基本字根与基本字根或基本字根与单笔划,按照一定关系组成的。基本字根在组成汉

13、字时,按照它们之间的结构关系也可以分为四种类型。1、 单:基本字根本身就单独成为一个汉字。如:“八、用、斤、广、车、马、雨”等称为 成字字根 ,它们的取码有专门 的规定,不需要判别字型。2、 散:指构成汉字的基本字根之间的相互位置关系,分别归属于左右、上下之一;换句话说,只有散结构才有左右、上下可言,这为我们区分字型带来了极大的方便。3、 连:指一个基本字根连一个单笔划。如:“丿”下连“ ”成为“生” , “丿”下连“十”成为“千”, “ ”下连“丶”成为“久”等。其中单笔可连前也可连后。值得提醒的是:这种情况下的单笔与字根之间,不能当作散的关系,其字型代号仍为“3”型。 连的另一种情况是“带

14、点结构” 。例如:“勺、术、太、主”等字中,点的远、近、连或不连,为了使问题简化,我们规定,一个基本字根之前或之后的孤立点,一律视作与基本字根相连。则带点结构其字型代号也归于“3”型。4、 交:是指几个基本字根交叉套迭之后构成的汉字。如:“农”是由“冖”和“ ”, “韦 ”是由“二、丨” , “夷”是由“一、弓、人”交叉构成的等等。字根组字中,还有一种情况就是混合型,如“丙”字,包括了五种基本笔划,可以看出:相交结构都属于“3”型汉字。这样,以上可概括为五笔字型的“543”特征,即 5 种笔划、4 种关系(笔划间的 4 种关系和字根组字时的 4 种关系) 、3 种字型。练 习1、按照组成汉字的

15、字根之间的位置关系,汉字分为哪几种类型?它们各自的字型代号是什么?2、请将下列汉字按单、散、连、交归类,并写出各自的字型代号。汗早夯户幻勾固剂忌笺见市井库君卡刊里气泉冉杀申好农立目刃丘产玉下面应讲字根键位图(第三章) ,学完字根键位图后再回来学习下面的末笔字型交叉识别码。#第六节 末笔字型交叉识别在前面讲述笔划代码和字型代码时,都分别提及,为了离散重码,有些汉字在键入其字根后,还要键入它的末笔划代码;有的汉字在键入字根之后,还有必要键入它的字型代码。五笔字型方案中, 把这两种代码(代号)合并成一组,以末笔代号为区号,字型代号为位号,成为一个“末笔字型交叉识别码 ”。 不管一个字需要的是末笔识别还是字型识别,都将“末笔字型交叉识别码”一起加给它,让二者各起各的作用。我们知道,在“五笔字型”中,笔划分五种,字型分三种,那么,末笔笔划和字型配合交叉的可能性就有 53=15 种。这样,重码率就可大大降低。“末笔字型交叉识别码”如下表所示。笔划 字型 左右型

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号