42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字

上传人:飞*** 文档编号:36273325 上传时间:2018-03-27 格式:PDF 页数:3 大小:211.97KB
返回 下载 相关 举报
42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字_第1页
第1页 / 共3页
42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字_第2页
第2页 / 共3页
42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字》由会员分享,可在线阅读,更多相关《42卷本方言词典用字统计研究——兼论吴语与江淮官话词汇用字(3页珍藏版)》请在金锄头文库上搜索。

1、 曩 囊 j 要 i : 2 0 1彝第 第 期 ) 夫 教 喷 4 2卷 本 方 言 词 典 用 字 统 计 研 究 兼论吴语与江淮官话词汇用字 吴 莉 滕 菲 ( 南京师范大学文学院, 江苏 南京 2 1 0 0 9 7 ) 摘 要 : 本文统计分析 了李荣主编4 2 卷本方言词典的用字。依照方言词汇复现次数的高低, 提取出低频词用字表和共 有词用字表, 据此统计方言词频与用字量的关系。 然后抽取江淮官话与北部吴语在“ 衣、 食 、 住、 行” 四种义类上的方言用字, 初 步探 求这 两个方言 区词 汇用字的特 点与差异 。 关键词:方言词汇 字表 用字量 词汇统计 一、本文研 究 目的与

2、 研究方案 1 研 究 目的 通 过统计 、 处理4 2 卷本 方言 词典 中的低 频词 和共有 词 , 得出4 2 卷本方言词典低频词用字表和共有词用字表,为课 题 “ 汉语方 言 自然 口语有声 基 础语料库 建设 ” 采 录字 表的 设 计提供 一种 资料参证 ,同时也 为 日后他 人进行 方言 调查 时 制定字表提供参考。 基于以上统计数据 ,以江淮官话和北部吴语为专题研 究对 象 比较 两者 “ 衣 、 食 、 住 、 行 ” 四种 义类词 汇在 用字量 上 的差 别 , 以考察 这两个方 言 区词汇用 字 的特征 与差异 , 以及 方言 词汇用字 与区域文化 的关系 。 2 研 究

3、材料 本 文统计研究 的基础材料是 “ 4 2 卷本方 言词汇集 ” , 该词 汇集由南京师范大学文学院2 0 0 6 级硕士研究生张笑芳整理 李荣先生主编的4 2 卷本 现代汉语方言大词典 所得。它按照 现代汉语方言大词典 划分词汇的3 0 个大义类 , 把各方言点 义类相 同的词 集中在同一张e x c e l 表格 中 , 共形成3 0 张e x c e l 表 格 : 一 、 天文 , 二 、 地 理 三 、 时令 时间 , 四、 农 业 , 五 、 植 物 , 六 、 动 物, 七 、 房舍 , 八、 器具用品, 九、 称谓, 十 、 亲属 , 十一、 身体, 十 二 、 疾病医疗

4、, 十三 、 衣服穿 带 , 十 四、 饮食 , 十五 、 红 白大事 , 十 六、 日常生活 , 十七、 讼事, 十八、 交际, 十九 、 商业交通, 二十、 文化教育, 二十一、 文体活动, 二十二、 动作, 二十三、 位置, 二 十 四 、 代词 , 二十五 、 形 容词 , 二十六 、 副词介词等 , 二 十七 、 量 词 , 二十八 、 附加成分 , 二十九 、 数字等 , 三十 、 其他 。这3 o 卜 义 类基本涵盖了人们生活的各方面, 不仅反映了当地人民的生 活面貌, 也利于本文对方言区各义类用字的比较与分析。 “ 4 2 卷本方言词典词汇集 ” 汇集了 现代汉语方言大词 典

5、的所有词汇 , 覆盖十大方言区( 官话 、 赣语、 徽语、 晋语 、 客 家话、 闽语、 乎话、 吴语、 粤语 、 湘语 ) 的4 2 个方言点 , 能够较好 地反映我国方言词汇的基本面貌方言分区与各地域文化 也大体 对应 , 利于进行方 言 区之 间的 比较 。 3 研 究方 法概 述 要功能是把一列 中的数据分成两列或多列 ,用分列法可提 取方言词 汇的用字 。 ( 2 ) 分类 汇总法 : 按 指定 的分类变 量值 对所有 记录进 行 分 组 , 以便 对每 组变 量 中的各 记 录进 行描 述 、 统 计与 分析 , 便于不同义类、 词频、 方言问的用字提取与比较。 ( 3 ) 算术统

6、计法: 用简单的算术统计法提取4 2 卷本方言 词典共有词用字表 、 低频词用字表, 分析低频词各义类用字 百分比, 以及江淮官话区与吴语区“ 衣、 食 、 住 、 行” 四类词用 字 量。 ( 4 ) 比较法 : 将4 2 卷本方言词典共有词用字量与低频词 用字 量进行 比较 , 得 出方 言词频与用 字量间 的关 系。同时 以 江淮官话和北部吴语在“ 衣、 食 、 住、 行” 四义类中的低频词用 字比较为例 。 探求不同方言区词汇用字特点与差异。 ( 5 ) 图表法 : 本文将用 图表显示统计、 比较各项数量关 系 , 便 于直 观观察 与分 析 , 从而 得出最终结论 。 4 术 语 释

7、 义 ( 1 ) 词频 : 本 文指某 个方 言词在4 2 卷本方 言词 汇 中出现 的频率。 ( 2 ) 低频词 : 本文指在4 2 卷本方言词典中出现频次在1 3 次 以下 的词 。 ( 3 ) 共有词 : 本文指在4 2 卷本方言词典中出现频次在1 3 次及 以上的词 。 ( 4 ) 义类 : 本 文指4 2 卷本方 言词 汇集 中按 e x c e l 表格 整理 的天文 、 地理 等3 0 个分类 。 ( 5 ) 共有 词用 字 : 本文指4 2 卷 本方言词 典 中构成共 有词 的所 有用字 ( 6 ) 低频词用字 : 本文指4 2 卷本方言词典中构成低频词 的所有用字 。 ( 7

8、 ) 总复现次数 : 本文指某个方言词在4 2 卷本方言词典 中重复出现的次数。 二、 4 2 卷本 方言词典低 频词用字表 的研 制 1 筛选 低 频 词 ( 1 ) 分列法 : “ 分列” 是e x e e l “ 数据” 菜单下的子菜单, 主 以方言词汇的“ 总复现次数” 作为区分低频词和共有词 一1 1 9 汉语言文学研究 的参 量 , 根 据张 笑芳 的研究 , 以“ 1 3 ” 作 为低频 词 和共有 词的 分界 点 。笔者 首先对 “ 4 2 卷本方 言 词典词 汇集 ” 按 义类划 分 的3 0 张e x c e l 表格进 行相关 处理 ,筛 选 出每 张表 格 巾总 复现

9、次数 在1 3 次 以下 的词。筛选的具体 过程如下 : ( 1 ) 打开“ 天文” 义类的e x c e l 表格一点击“ 数据” 菜单下 的子菜单 “ 排序 ” 按 钮一分 别 以“ 总 复现次 数” 和“ 词 条 ” 作为 主要关键字和次要关键字 按升序排列一点击“ 确定” , 使词 条按 照 由低到 高总复现次数依 次排列 。 ( 2 ) 存 “ 总复 现 次数 ” 这 一列 找 到“ l 3 ” 这 一 临界 点一 删 除 该 表 巾总 复现 次 数 在 l 3 次 以 上 的词 条一 得 到 该 表 的低 频 词 。 ( 3 ) 依次打l开其余各义类f1 x c e l 表格 重复

10、上述2 个步 骤 筛选出3 0 张e x c e l 表巾的低频词, 并保存。 2 对 低 频 词 做 分 歹 1 处 理 通过上述 操作 得 到 了各 方言点 在3 0 个 义类表 巾 的低 频词表 。研制低频 词的用字必须 以字为单位 , 本文用分列法 提取低频词 表的用字 : ( 1 ) 打 开 经 筛选 过 的 “ 天文 ” 义 类e x c e l 表 格一 选 中 “ 词 条 : 一列 ( 此 处的词均 为低频词 ) 一 点击“ 数据 ” 菜单下 的子 菜单 “ 分列 ” , 将 多字词条 分列为单字 。 ( 2 ) 在弹出的文本框向导中选中“ 固定宽度” , 点击“ 下一 步 一

11、 设置字段宽度 ( 2 个字符 ) 一 单击 鼠标建立分列线一 点击 “ 完成” , 把该表巾低频词在不同位置上的用字分列提取出来。 3 册 4 除低频词 的重复 用字 基于 上节 的操 作 , 把 “ 天 文 ” 义类 e x c e l 表 格 中低 频词 在 不 同位置 上 的用 字提 取 了来 , 因只是 简单 的“ 分 列” , 其 中 必然包 含 大 量 重复 用字 , 因此要 进一 步 整理 , 删 除 重复 的 用字 。 ( 1 ) 打开一张新 的e x c e l 表格 , 通 过“ 复制 ” 与“ 粘 贴” , 把 刚 刚分 列所得 的各 列用字集 巾于一列 。 ( 2 )

12、 选 中该列用 字一 点击 “ 数据” 菜单 下的子菜单 “ 排序 ” 按钮, 选“ 升序排列” , 让重复的汉字集中在一起。 ( 3 ) 选中重新排序的这列用字一点击“ 数据 ” 菜单下的 子菜单 “ 删除重复项” , 删节该列中重复的字一 得到“ 天文” 这一义类低频 词用字表一保存 文件 为“ 天文类低频词 用字表 ” 。 ( 4 ) 依次打 开其他各 义类e x c e l 表格 , 重 复上述 ( 1 ) 一 ( 3 ) 的 操作 , 得 卅4 2 卷本 方言词 典各 义类 的低 频词 用字表 , 并 分别 保存 。 4 汇 总各 叉类低 频词 用 字表 , 最终 形成 “ 4 2

13、卷 本方 言词 典低频 词用 字表 ” ( 1 ) 建立一张新的e x c e l 表格, 依次打开新保存 的各义类 低频词用字表, 通过“ 复制” 和“ 粘贴” 操作, 把各义类的低频 词用字集中到新建的e x c e l 表格巾的一列。 ( 2 ) 选中该列用字 , 点击“ 数据” 菜单下的子菜单“ 排序” 按 钮 , 使其 按升序排列 , 让重复 的汉字集 中在一 起。 ( 3 ) 选巾重新排序的这列用字一点击“ 数据” 菜单下的 子 菜单 “ 删除重 复项 ” 一删 节该列 中重 复的字一 得 N4 2 卷本 所有低 频词 的用字一 保存 文件 名 为“ 4 2 卷本 方言 词典低 频

14、 词 用字表 ” 。 三 、 4 2 卷本方言词典 共有词用字表 的研制 “ 4 2 卷本方 言词共 有词用 字表 ”的研制 与 E 节研 制 “ 4 2 卷 本方言词 低频词用 字表 ” 大致 相 同, 只是 在最初 筛选共 有 词 时 , 要 选择 “ 总复现次 数” 在l 3 次 以上 ( 含l 3 次 ) 的词 其余 操作 步骤相 同。 四、 4 2 卷本方言词 典低 频词与共有词 用字分析 将 “ 4 2 卷 本方 言词 典 低频 词用 字表 ” 和“ 4 2 卷本 方 言 词 典 共有词 用字 表” 合 为一 张表 , 即依照 第三 节 巾( 2 ) ( 3 ) 步骤 排 穿 、

15、删重 , 得到“ 4 2 卷 本方言词典词 汇用 字表” 。 统计这 三张 表 中方言词汇 的用 字量 , 得 到表1 的数据 。 表 1 4 2 卷本方 言词 典低频词 、 共有词和所有 词用字量 4 2 卷本 4 2 卷本方 4 2 眷奉方者 训典 词种类 词典低频词 词典共有词 所有词总用字量 崩宁量 7 6 2 5 1 6 6 2 7 6 2 8 占总用字量的比重 9 9 9 2 2 8 4 2 卷本方言 词典词 汇总 的用字量 为7 6 2 8 个 总复现 次 数在l 3 次 以下 的低频 词的用字 量是7 6 2 5 总复现 次数在 1 3 次 以上 ( 含1 3 次 ) 的共有

16、词的用字量 为1 6 6 2 , 两者在 总用字量 中 所 占的比重 分别为9 9 9 和2 2 8 。由此 可见 , 方青 词汇低频 词的总复现次数 虽然较 低 , 但 其用 字的涵 盖面却 是相 当广 , 基本囊括 了共有词 的用字 。 低频词的复现次数虽然不多,但却集中显现了方言点 的词汇特点。在4 2 卷本方言词典中复现次数为1 的词 , 意味 着 只在此方 言巾出现 , 而彳 F 其他4 1 个方 言巾未见 , 应 是典型 的方言特征 词 , 是 考察方 言词 汇特点 的好材 料。于是 , 我们 统 计 “ 4 2 卷本 方 言词 典词 汇集 ” 中 只出现一 次 的词 , 其 数量 为 1 6 7 5 8 0 , 约 占方言 词典 收词 总数 的4 7 , 可见 这些 词 的比 重之大 。 综合以上两点, 笔者认为低频词用

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号