5.3 现代汉字数量多,是汉字的特点,也是难学的原因之一出土的甲骨文中有字形4,000多个,可以解读的 1,000多个我国最早的字典东汉许慎所著《说文解 字》收字9,353个(另有异体字1,163个),宋朝陈彭 年等著的《广韵》有字26,194个,明代梅膺祚所撰 《字汇》收33,179字,《康熙字典》有字头47,035 个,1990年出版的《汉语大字典》收字54,678个, 1994年出版的《中华字海》收字85,568个,北京国 安咨询设备公司汉字字库,收有出处的汉字91,251 个,据称是目前全国最全的字库有人认为全部汉字有10到12万个5.3.1 汉字的数量 5.3 现代汉字可以看出,从小篆开始,汉字数量是不断增加的实际上,近10万汉字,是古今、异地使用过汉字的 汇集其中,很多是不同时代、不同地方的人用不同 方法造的表示同一个词或语素的字——异体字(异形 字),有的是同形异构造成的,有的是与时俱进造成 的,有的还是因前人写错而流传给后人的异体字例 如,灾災菑烖 帮幇幫幚鞤 蛔痐蚘蜖蛕岩喦巖巗 炮砲礮 鸡鷄雞 棋棊碁 5.3.1 汉字的数量 5.3 现代汉字其实,要是做一番整理,在把这些字的演变和变 异过程查清楚的基础上,去掉古体、异体和讹变等 字形(同字异形的保留一个),实际上使用过的汉 字总数量大约有两万来个。
实际上,与庞大的汉字总数量形成鲜明对比的是 ,历代应用书面语常用的不同汉字数量一般都不超 出三四千个《雷雨》和《茶 馆》的字数分别是 51,699和35,034 ,可使用不同汉字分别为1,646个 和1,571个《骆驼祥子》十几万字,用不同汉字 2,413个《毛泽东选集》四卷字数共660,273,使 用不同汉字仅2,981个5.3.1 汉字的数量 5.3 现代汉字对一般人来说,认识3、4千字,看书报覆盖率达 到99%到99.9%足够了所以,1988年发布的《现 代汉语常用字表》收2,500个常用字、1,000个次常 用字,总共只有3,500字,是合理的一万个汉字, 几乎是社会用字的上限—文字工作除外5.3.1 汉字的数量 据统计统计 ,认识认识 160个汉汉字,看书报时书报时 是就能覆盖 50%,认认1,000个汉汉字,能覆盖0.9(90%)据我 们们研究,字种数和覆盖率有以下关系:覆盖率0.90.990.9990.99990.999990.9999990.9999999 字种数1,0002,5004,0005,5007,0008,50010,000 增加字种-1,5001,5001,5001,5001,5001,5005.3 现代汉字汉字字形复杂,是汉字难学的另一个原因。
对现代汉字做共时的分析,可以从汉字的字形是如 何构成的角度分析,也可以从汉字的字形与字音、字 义的关系上分析前者叫构形,后者叫构字 5.3.2.1 现代汉字的构形 1、笔画构成汉字的基本单位是笔画——书写汉字时落笔到 起笔画出的线条这是汉字构形的最小单位笔画的 具体形状繁多,有人举出近30种现在,把汉字的基 本笔画归纳为五种:“横、竖、撇、点、折”(一、丨、ノ、丶、フ),并用数字1、2、3、4、5来代表 5.3.2 汉字的字形 5.3 现代汉字2、部件部件是由笔画组成的单位,大于或等于笔画,小于 或等于整字部件包括传统的部首和声旁部件组合 成汉字有的部件只能称为一个整字的一部分,如“ 乇、亻”,有的部件可以单独成为整字,如“人”、“小 ”,有读音和意义如何分析、确定部件,是现代汉字研究、应用中常 常争论的问题如“小、示、孑、孓、刂”据统计,现代汉字有600多个部件部件数量多是 汉字输入形码重码率高的原因 5.3.2 汉字的字形 5.3 现代汉字3、整字整字是指单个的汉字,有读音和意义,是汉字的使 用单位整字可以分为独体字和合体字两类1)独体字:一个部件构成的汉字例如“日、月、 人、山、木、一、二、上、下”及“水、刁、小”等等 。
据统计,独体字占现代汉字数量的4%左右2)合体字:两个或两个以上部件构成的汉字合体 字中部件组合的结构模式可以分为4大类5.3.2 汉字的字形 5.3 现代汉字3、整字合体字中部件组合的结构模式: (1)左右结构 ①左右: 休、捧、都、划、对、敏 ②左中右:粥、树、哪、做 (2)上下结构 ③上下:忠、盖、员、笔、墨、唇 ④上中下:翼、草、薯、害 (3)部分包围结构 ⑤三面包围:用、同 ⑥左上包围:压、厌5.3.2 汉字的字形 5.3 现代汉字3、整字 (3)部分包围结构 ⑦右上包围:句、司 ⑧左下包围:远、起 (4)全包围结构: ⑨里外结构:国、圆5.3.2 汉字的字形 5.3 现代汉字5.3.2.2 现代汉字的构字从汉字的字形与字音、字义的关系上分析现代汉字 ,叫构字 1、记号字笔画的组合(部件)与音、义没有联系就是记号, 这样的部件组成的的字是记号字独体记号字由一个记号组成,多数来源于古代的象 形字,如“日、月、山、人、大、刀、子、女、手”, 有的来源于简化,如“书”5.3.2 汉字的字形 5.3 现代汉字5.3.2.2 现代汉字的构字1、记号字合体记号字由两个以上记号组成。
有的来源于古代 的象形字,如“马、鱼、燕、鼎、鹿、龟”;有的来源 于古代的形声字,但是现在这些字的意符和音符都失 去了表意或表音作用而成为记号,如“骗、特、聊、 龛”;还有的来自古代的会意字,如“射、至”5.3.2 汉字的字形 5.3 现代汉字2、 会意字由两个或两个以上有意义的部件构成的汉字有的 会意字是从古文字延续下来的,如,从:一个人跟一个人跟从”的意思析:从木从斤用斧头劈树分析”的意思尖:上面小,下面大森:木是树,三表示多森林”的意思有的是后来造的,如尘:小的土就是尘灭:把火压住,表示灭5.3.2 汉字的字形 5.3 现代汉字3、形声字由表示字义类别的部件(义符)和表示字读音的部 件(音符)构成的汉字是形声字现代汉字中的形声 字中,少数字的音符与字音完全相同的,如,疤、搬 、态、枫大多数形声字中的音符只与字音的声、韵 、调中的部分相同,如,“缸”、“淆”、“病” 4、半形声字来源于古形声字随着语音和字义的变化,字里 的声符不表音了或意符不表意,分别成了记号,整个 字称为“半形声字”5.3.2 汉字的字形 5.3 现代汉字现代汉字字音特点 ①一个汉字的读音是一个音节:“吋浬”等废止; ②字音大都不能通过字形显示出来;对《现代汉语通用字表》7,000字中的5,636个形声字的声 旁(音符)与字音的比较研究发现声旁表音情况如下: 5.3.3 汉字的字音 异同 类别类别声韵调调声韵调调声韵调调声韵调调 +++++-+-+-++ 字数2285882212309 比率%40.5415.653.765.48 类别类别声韵调调声韵调调声韵调调声韵调调 +---+---+--- 字数241591408708 比率%4.2810.497.2412.565.3 现代汉字能够表音的形声字的声旁,存在以下问题,有些声旁不是现代汉字的整字。
如,辨辯辦辮 凌棱菱陵稜 检脸验险有些声旁是冷僻字和非常用字如,蚩—嗤、媸 牟—眸、侔、蛑氐—低、底、低、砥、抵 丏—沔有些声旁的音形不单一敫—缴、徼、激 顷—倾颖声旁位置不固定,可以在任何位置如,扒 辩 刚 赢 颖 病 扈 蒲 竺 哀 闻 匾 园声旁部位多变,表音效应不强,更增加汉字认读的困难 5.3.3 汉字的字音 5.3 现代汉字③有些字不止一个读音:一个字对应几个读音; ④有些字不止一个字形:几个字形表示一个汉字 称为异体字或异形字; ⑤同音字多通用的现代汉字以10,000个为限,按400多个音 节分组,平均每组对应25个字左右实际每组音节 对应的字数多少不等,yi音节所对应的字数最多, 共135个如果音节加声调,共有1,300左右带调音节,平均每组音节对应8个字上下,音节y<有35个字5.3.3 汉字的字音 5.3 现代汉字⑥多音字多现代汉字有几百个多音字,如,龟①guī,乌龟;②jūn,龟裂(同皲裂);③qiū ,龟兹(地名) 有的字甚至有五个读音,如,和:①hv, ② h+, ③hu;, ④ hu@, ⑤ h\。
读音不同,意义也不同这就给汉字的学习、使用造成很大困难——难念是汉字难学的另一个原因5.3.3 汉字的字音 5.3 现代汉字1、汉字表义的特点 ①汉字表示语素汉字一般与汉语词里的语素对应如,人民,说汉字不对应语素的情况有两种:组成连绵词的字:犹豫、仿佛、蜘蛛橄榄、旮旯、烂漫蝴蝶、蟋蟀、芙蓉借词(外来词):约翰、斯大林、巴拿马、乌鲁木齐、里约热内卢咖啡、啤酒、巧克力、诺基亚、阿尔卡特5.3.4 汉字的字义 5.3 现代汉字1、汉字表义的特点 ②一个汉字常常对应多个语素一个汉字常常对应多个语素现代汉字多数都对应 一个以上语素,是所谓的多义字在字典、词典里,多义字的每个义列为一个“义项” 如“打”有25个义项一个字的诸义项里,有的是本义,有的是基本义,有的是引申义和比喻义如,“水”的基本义是H2O,本 义是“河流”,引申义是“液态的东西”,汽水、铁水,“ 水货”、“这个动作特别水”中是比喻义5.3.4 汉字的字义 5.3 现代汉字2、义符表义的局限性一般认为义符(形旁)是表示字义的实际上,形旁 只起提示字义的范围的作用如,从“扌”的字多与手 有关,从“钅”的字常与金属有关,等等。
但是这种提示作用是有限的据有人对现代形声 字义符表义情况的统计,只有极少的一部分形声字字 义与形旁义相同,占形声字的0.85%,大多数形声字 字义与形旁义只是相关,占形声字的85.87%,甚至 还有一些字的字义与形旁义看不出有任何联系,占形 声字的13.26% 5.3.4 汉字的字义 5.3 现代汉字2、义符表义的局限性据我们对汉字表意度的研究,GB2312里的汉字 的表意度最高为1,最低为0,平均19.09771206% 5.3.4 汉字的字义 分组组表意度B占百分比 第一组组 B = 10.0025617140 第二组组0.8 B < 10.0081509082 第三组组0.6 B < 0.80.0060549604 第四组组0.4 B < 0.60.2470889613 第五组组0.2 B < 0.40.1823474616 第六组组0 < B < 0.20.1809501630 第七组组 0 = B0.37284583145.4 汉字的整理和规范1、整理异体字许多汉字有不同字形整理异体字是在不同字形 中确认一个是正体,其他是异体。
整理的结果是淘汰 异体字1955年12月22日发布《第一批异体字整理表》, 对810组1,865个异形字加以整理,淘汰异体字1,055 个如,畝[畆畮畒](淘汰五个异体字)劫[刼刧刦](淘汰三个字)1956年3月23日加以修正,恢复“阪挫”为正字 5.4.1 汉字的整理 5.4 汉字的整理和规范1、整理异体字1986年10月重新发布《简化字总表》时,恢复被 《第一批异体字整理表》淘汰而《简化字总表》第三 表收入的11个字为正字 讌晔詟诃鰌 刬鲙诓雠1988年3月25日国家语言文字工作委员会和新闻出 版署发布《现代汉语通用字表》,其中恢复被《第一 批异体字整理表》淘汰的15个异体字为正字翦邱於澹骼彷菰溷徼薰黏桉愣晖凋最终,异体字整理淘汰的异体字实际为1027个5.4.1 汉字的整理 5.4 汉字的整理和规范2、统一字形印刷用的不同字体在笔形、笔势上有不少差别。