广义配价模式与汉语“把”字句的句法语义规则

上传人:豆浆 文档编号:4338728 上传时间:2017-08-18 格式:PDF 页数:11 大小:354.12KB
返回 下载 相关 举报
广义配价模式与汉语“把”字句的句法语义规则_第1页
第1页 / 共11页
广义配价模式与汉语“把”字句的句法语义规则_第2页
第2页 / 共11页
广义配价模式与汉语“把”字句的句法语义规则_第3页
第3页 / 共11页
广义配价模式与汉语“把”字句的句法语义规则_第4页
第4页 / 共11页
广义配价模式与汉语“把”字句的句法语义规则_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《广义配价模式与汉语“把”字句的句法语义规则》由会员分享,可在线阅读,更多相关《广义配价模式与汉语“把”字句的句法语义规则(11页珍藏版)》请在金锄头文库上搜索。

1、广义配价模式与汉语“把”字句的句法语义规则*詹卫东 北京大学中文系 提要 本文分为三个部分 。第一部分 扼要介绍一 个词汇语义 知识表达框 架:广义配 价 模式。 这个模式是对传统配价理论的扩充; 第二部分以汉语的 “把” 字句 为处理对象, 尝试为计算机分析汉语的 “把” 字句提供句法语义规则, 规则中有关 “把” 字句里动词短语 ( VP)的语义约束, 就是在广义配价模式基础上进行的; 第三部分分析了若干跟 “把” 字 句有关的歧义实例,以说明本文所提出的形式规则的效果。 关键词 配价 广义配价模式 句法语义规则 “把”字句 歧义消解 1 一个增广的语义知识表达框架:广义配价模式 1.1

2、背景 句法分析的直接目标是要得到句子的直接组成成分以及成分间的句法关系; 语义分 析的直接目标是要说明句子中组成成分之间的语义关系。 对计算机分析而言, 要达到上述两个目标, 必须依 赖一定的语言知识, 语言 学家的工 作就是来发掘这样的语言知识, 并以一定的形式化手段来表述这样的语言知识 (而不是以自然语言的方式来表述) ,让计算机能像人一样掌握这些知识。 在依存语法 ( Dependency Grammar) 中提出的配价理论 ( Valency theory) , 就是一套比较有效的可以用来表达实词语义知识的模式。 举例来说, 基于配价理 论,我们可 以这样描述 汉语中的动 词“搬” 。

3、这个动词要求 两个配价成分 (由名词性成分充当) 出现在它周围, 形成合法的句法结构, 比如 “张三 搬石头” ,其中“张三” , “石头”就 是动词“搬 ”的两个配 价成分。更 进一步, “张 三”是施动 者(发出 “搬” 这个动作的主体) , “石头 ” 是受动者 (被 “搬” 这 个动作影响的动作对象) 。 并且,“搬” 要求施动者是人或动物类的名词, 受动者是具体可感的实体。 如果这样的知识以一定的方式记录在计算机中, 计算机就可以理解 (也可以生成) 像 “张三搬 石头” 这样合乎汉语语感的句子,同时排斥“ *石头搬张三” , “ *张三搬理想”这样的不合乎汉语语感的句子。 不过,仅

4、有上述知识,计算机仍然不能处理下面的问题: ( 1) “张三搬累了” , “屋子搬空了”是合乎汉语语感的,而 “ *张三搬薄了” , “ *屋子搬真了”是不合乎汉语语感的。 ( 2) “张三搬光了所有的石头”是合乎汉语语感的,而 “ *张三搬累了所有的石头”不合乎汉语语感; 对此, 就需要我们给计算机提供更多的知识, 这包括两个方面: 提供什么知识, 以及如何 提供。 实际上, 来自中文信息处理领域的应用需求促使我们对原有的配价理论作更多的思考并尝试构建表达力更丰富的模式。 很明显, 问题主要集中在两个方面: 一方面, 原有的配价 理论对于动词的配价性质及其对句法结构造成的影响比较重视, 对动

5、词跟名词的配价关系研究比较充分, 但对动词跟其他实词 (比如形容词) 的组配性质研究不多, 比如上面所举例子中,*本文研究工作得到 “高等学校全国优秀博士学位论文作者专项资金” (项目编号 200110) 资助。 本文初稿曾在 “新世纪第二届现代汉语语法国际研讨会” 上宣读过, 根据与会代表的意见做了一些修改。 谨致谢意。 1动词“搬”跟形容词“累” , “空” 等可以组配,但跟“真” , “薄”等无 法组配;另一方面,传统的配价理论对动词变成动词短语过程中, 配价性质的动态变化关注不够, 比如上面例子中, “搬累” 跟 “搬” 的配价性质相比, 已经发生了变化, 因而不能跟 “所有的石头”

6、组配。上述两方面的语言事实,都应该有一套方式去刻画它1。 下面介绍的广义配价模式 ( Generalized Valence Mode) 就是为 此所做的一点探索和尝试。 1.2 广义配价模式 针对上面两方面的问题,广义配价模式尝试在两个方向上对原有的配价理论进行拓展:横向上, 不仅描述动词跟名词的配价信息, 还试图把形容词跟名词, 动词跟形容词等的组配约束包括进来 (这无疑对描述汉语中动词与形容词搭配构成述补结构的性质有支持作用)2;纵向上,从词拓宽到短语,比如应该描述动词短语(述补结构,述宾结构)的配价性质。 上述横向上的拓展可以反映在电子词典中。 在词典中, 除记录动词与名词的搭配约束外

7、,还通过一定方式记录动词与形容词的搭配约束。 纵向上的拓展则主要反映在分析规则中, 比如在有关述补结构,述宾结构的规则中,可以一定的方式描述整个结构的配价性质的变化。 下面通过举例来说明。 (一) 在词典中记录动词跟形容词的组配约束信息 请看词典中对动词“洗” 、 “晾” ,形容词“干净”的广义配价语义属性表示3: 洗 ( 1)配价数: 2; ( 2)论元角色语义约束:主体: 语义类:人 ;客体: 语义类:衣物 ( 3)配价成分变化:主体变化: 人性 ;客体变化: 物性 4晾 ( 1)配价数: 2; ( 2)论元角色语义约束:主体: 语义类:人 ;客体: 语义类:衣物 ( 3)配价成分变化:主

8、体变化: 人性 ;客体变化: 物性 | 位置 5干净 ( 1)配价数: 1 ( 2)语义类:物性 ( 3)论元角色语义约束:主体: 语义类:具体物 对每个动词 的描述都分 三个方面, 其中第( 1) 、第( 2)两个方面,以 往的汉语配 价理论研究已做 了不少的探 讨和描述。 而第( 3)个 方面,即标 注动词配价 成分的变化 情况,则是以往的语 义研究尚未 涉及的。上 面示例中, “ 晾”跟“洗 ”在“客体 变化”的性 质上显示出差别, 我们认为, “晾 ” 可以造成 “客体” 的位置变化 (可以说 “晾外边” , “晾 阳台上” ) ,“洗”则不 造成这种变 化(不能说 “ *洗外边” ,

9、 “ *洗阳台上 ” ) 。 “洗”仅仅造成“客 体”的“物性” 变化。 这里 “物 性” 是个语义范畴, 对应着一组形容词, 比如 “ 干 , 湿 , 干 净 , 脏,平, 皱, ” 等等, 这组形容词是用来形容物体的性质的。 在对形容词的语义属性描述中,通过“语义类”来反映这个特征值,比如“干净”的“语义类”取值就为: 物性 。另外,跟动词一样, 形容词也记录其 “主体” 论元角色的语义选择限制, 比如 “干净” 主要是用来修饰具体事物的,它的“主体”就取值为: 语义类:具体物 。 可以补充说明的是, 上面示例中 “洗” 和 “ 晾 ” 的 “客体 变化” 取值都笼统地记为 物性 , 有时

10、候根据实际需要, 还可以进一步细化6, 将典型情况标记出来, 比如 “洗” 标记为:客体变化 : 物性 : 脏 - 干净 ; 而 “ 晾” 标记为 : 客体变化 : 物性 : 湿 - 干 。 有了这样的2信息, 虽然不能解决动词 “洗” , “ 晾 ” 跟形容词的全部组配问题, 但至少有助于计算机判 断“洗干净” , “晾干”是 合乎语感的 ,而“ *晾饱 了” , “ *洗低了” , “ *洗短暂了”等是 不合乎汉语语法的。 显然, 通过 这种方式, 可以实现 (或者至少是部分地实现) 刻画动词跟形容词的组配约束的目的。 (二)在规则中记录从动词到动词短语配价性质的变化 请看汉语动词短语述补

11、结构规则的示例(下文 3.2.1 中也用到这条规则,可以参看) : vp - !v a : $.内部结构 =述补 , IF %v.主体 =%a.主体 THEN $.配价数 =1 ENDIF, $.客体变化 =-位置 , 说明: ( 1) vp - !v a 是产生式 规则,表示汉语中动词( v)跟形容 词( a)可以结合成为一个动词短语( vp) ,其中 v 是中心词,用 !标记; ( 2) : 后面 部分是对这 条产生式规 则的属性特 征描述。 “ $.内部结构 =述 补”表示这 是一个内部构造为述补结构的 vp; ( 3)第一条 “ IF THENENDIF” 语句说明如 果述补结构 的补

12、语跟动 词的施动者 共指的话,整个述补结构的配价数就置为 1。这样的话,像“搬累”这样的述补式 vp 就不能再带客体宾语了; ( 4) 第二条 “ $.客体变化 =-位置” 语句说明该述补式 vp 不能 再带处所宾语了 (不过这类 vp 还可以 带其他 np 构 成 述 宾 结 构 , 比 如 “ 晾 干 了 全 部 的 衣 服 ” 。 ) 。根 据这条约束, “晾 ”这个动词本 来是有“客 体位置变化 ”属性特征 的,汉语中 可以说“晾 屋里” , “晾阳台上” ,但如果 “晾” 跟形容词组配成述补 vp 后, 就不再具有这个特征了, 不能说 “ *晾干阳台上” ,“ *晾干屋里” 。 对人

13、来说,也许上述规则约束显得多此一举7,但对计算机分析汉语短语结构而言 , 这样的规则是必需的。 比如有了上述规则的帮助, 计算机就可能对 “晾干阳台上的衣服” 做 出正确的分析: 晾 干 阳台上 的 衣服 - 整个结构被分析为动词短语( vp) 如果没有上述规则的帮助,就可能分析出错误的结构层次: * 晾 干 阳台上 的 衣服 - 整个结构被分析为名词短语( np) 以上扼要介绍了广义配价模式的基本思想, 并通 过示例展示了基于广义配价模式形式化地组织语言知识的具体做法。 值得指出的是, 在实际的自然语言处理系统中, 词典与规则作为语言知识的主要载体, 是紧密结合, 共同发挥作用的。 有关广义

14、配价模式及有关形式化方法的更为详细的阐述,可参考詹卫东( 2000)的论述。 下面以“把”字句的分析为例,进一步说明广义配价模式的应用。 2 “把”字句的句法语义规则 2.1 汉语“把”字句可以概括为这样一个格式8: () + 把 + NP + VP 这个格式中 “把 +NP” 部 分 , 我们称之为 “把” 字结构。 本文称 “把” 字句时, 是指 “把 ”字结构前加 NP,后加 VP 形成的构造9。 关于汉语中的“把”字句,有很多问题值得研究,比如: ( 1)哪些 VP 能跟“把”字结构组合,即能出现在“把”字句中? ( 2)如何概括“把”字句的整体语义特征,即给出“把”字句的语义解释?

15、( 3) “把” 字结构跟 VP 组合后形成的构造 ( “把” 字句) , 能有哪些相关的变换句式以及有何变换条件? 3( 4)什么语境下适宜用“把”字句表达,什么语境下又排斥用“把”字句? ( 5) “把”字句在汉语大规模真实语料中的分布情况如何? 事实上, 有关这些问题, 前人也已做过不少研究10, 但以给出供计算机分析 “把” 字句的规则为研究目标的工作则还很少见到。 此外,对面 向人的研究 而言, “把”字句这个名 称听起来似 乎是划定了 一个研究范 围,但对计算机而言, 研究 “ 把 ” 字句, 实 际上就等于研究全部汉语的句法结构, 因为要给出计算机分析 “把” 字句的规则, 就是

16、要明确指出什么样的结构能出现在 “把” 字句中, 什么样的结构不能出现在“把”字句中。这无疑就等于要把全部汉语短语结构梳理一遍,只不过,梳理时有个特定的角度, 即已 “把” 字句为格式框架来进行梳理。 这一点, 也是面向计算机进行语法研究更面向人进行语法研究很不相同的一个方面。 理解了这一差异, 读者对下文中对“把”字句十分繁琐的规则描述会容易接受一些。 本文对 “把” 字句的分析探讨, 就是 尝试给出能对计算机分析 “把” 字句 有直接支持作用的句法语义规则,也即寻求上面第( 1)个问题的答案。 2.2 下面对汉语“把”字句的分析分三步展开。 2.2.1 第一步首先从对“把”字句中的两大成分 NP, VP 的描写入手。 可以从两个

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号