hpsg理论简介

上传人:luoxia****01819 文档编号:48129278 上传时间:2018-07-10 格式:PDF 页数:18 大小:207.59KB
返回 下载 相关 举报
hpsg理论简介_第1页
第1页 / 共18页
hpsg理论简介_第2页
第2页 / 共18页
hpsg理论简介_第3页
第3页 / 共18页
hpsg理论简介_第4页
第4页 / 共18页
hpsg理论简介_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《hpsg理论简介》由会员分享,可在线阅读,更多相关《hpsg理论简介(18页珍藏版)》请在金锄头文库上搜索。

1、HPSG 理论简介理论简介 吴云芳 北京大学 提要提要 本文概要介绍了 HPSG 理论(中心语驱动的短语结构文法) 。表层导向、基于约束和词汇主义是 HPSG 的主要理论主张;特征结构是 HPSG 描述语法信息的主要手段;词汇类体系结构和词汇规则构成了 HPSG 的词汇体系;中心语补足语规则、中心语指定语规则等以及中心语特征原则、值传递原则等构成了 HPSG 的规则系统。文章最后对 HPSG 和 GB 理论进行了简要的比较。 关键词关键词 HPSG 句法理论 计算语言学 0. 前言 0. 前言 HPSG (Head-Driven Phrase Structure Grammar) ,即“中心语

2、驱动的短语结构文法” ,是现今西方很为流行的一种理论。Pollard and Sag(1987) 首先勾勒出了 HPSG 的原型,而后在 1994 年对其进行了一些改进,从而形成了一个完整的句法理论。今天,依据 HPSG 进行理论研究和依据 HPSG 进行计算语言学实践的都颇有学者在。后者如在德语、日语、英语三国语之间进行实时翻译的庞大的 Verbmobil 工程。 HPSG 研究的大本营在 Stanford 的 CSLI ( Center for the Study of Language and Information)1 。从 1994 年起,每年都有关于 HPSG 的国际会议召开,20

3、03 年将是第十届会议2。 象其他句法理论一样, HPSG 也是在不断的变化着、发展着。本文的叙述基本上依据 Sag and Wasow(1999)的版本。 1. 1. HPSG 的理论主张 的理论主张 HPSG 是基于约束的词汇主义,它来源于这样的心理语言学事实:语言理解是以一种 本文研究工作得到国家 973 项目(G1998030507-4,G1998030504-01)和 863 项目(2002AA117010-08)的支持。 1 本文的写作从Stanford 的网站上查阅了很多资料,网址是:http:/hpsg.stanford.edu/hpsg。 2 历届会议的时间和地点分别为: 第

4、九届, 2002, Seoul; 第八届, 2001, Trondheim; 第七届, 2000, Berkeley;第六届,1999,Edinburgh;第五届,1998,Saarbrcken;第四届,1997,Cornell University;第三届,1996, Pittsburgh;第二届,1995,Tubingen;第一届,1994,Copenhagen。第十届将于 2003 年在Michigan 召开。 1高度整合和渐进的方式进行的(in a highly integrative and incremental fashion), 语言的和非语言的因素掺和在一起共同参与语言理解的

5、过程。 具体讲, 基于约束的词汇主义包括下面三方面的内容: 1.1 表层导向 (Surface Oriented) HPSG 关注的是具体的、表层的结构。它认为,由词串的表层组成就可以直接推衍出一个句子是否合格。因此,任何抽象的、深层的结构(象空语类等)在 HPSG 中是不存在的。表层导向的结果是 HPSG 只有单一的句法结构(single level of structure) ,而不像生成语法那样存在多层句法结构。 1.2 基于约束 (Constraint Based) HPSG 认为,适合人类语言处理的的语法应该是一个约束描述体系。HPSG 整个的构架是建立在约束机制上的,词项(lexi

6、cal entry)描述、语法规则、语法原则等都是通过约束来实现的。 1.3 词汇主义 (Strict Lexicalism) 词语携带了丰富的句法语义信息,它在很大程度上决定了它所在句子的句法语义结构。反过来,句子之所以表现出不同的句法语义结构,也正是因为其中所包含的关键词语不同。HPSG 把语法规则的重担几乎全部转移到了词汇上,是严格的词汇主义。 2. 2. HPSG 的特征结构 的特征结构 特征结构(Feature Structure)是描述语法信息的一种手段,HPSG 广泛采用复杂特征结构来描述词语或短语信息。复杂特征结构是 HPSG 实现其“词汇主义”的主要手段,是 HPSG 理论的

7、重要组成部分。 请看下面关于“give”的描写: 2(1) word verb SYN HEAD FORM fin ARG-ST NPi , NPj , NPk give, MODE prop INDEX s RELN give RELN t-overlap SEM SIT s SIT u RESTR GIVER i , ARG1 s GIVEN j ARG2 now GIFT k 这里列出的是 “give” 主要的属性特征描述, 并不是其全部。 一个音义结合的语言符号 (sign)最基本的属性特征是: (2) PHON sign SYNSEM HPSG 不太关心 PHON (声音) 的特征。

8、 SYNSEM 是 SYNTAX 和 SEMANTICS 的合写,是 HPSG 主要关照的属性特征。 (1)描述的就是“give”的 SYNSEM 属性。 2.1 关于符号 表示属性特征矩阵(attribute-value matrix, AVM) ,它是用来描述复杂特征结构的主要工具。 表示属性特征的列表。 表示空表。 属性特征的特征值有两种形式:原子式 (atom)和特征结构。上例中, “FORM fin” 是一个原子式的特征值,HEAD verb 是以特征结构为值的复杂特征结构。传统 FORM fin 的短语结构文法(Phrase Structure Grammar, PSG)多采用原子

9、式的特征值,其描写能力受到很大的限制。HPSG 大量采用复杂特征结构来表示特征值(feature structure within feature structure) ,其描写能力大大加强了。 3在下文的描述中,经常会看到属性特征值用1,2,n 等表示,这称为“标签(tag) ” 。相同的标签表示结构共享(structure sharing) 。结构共享的成分,是严格的字标一致(token identity) ,也就是完全合一。正是在这个意义上,HPSG 属于合一机制的文法。结构共享是 HPSG 核心的描述机制,正如 “move ”是管辖与约束理论(GB) 核心的描述机制一样。 2.2 关于

10、 SYN SYN 用来描述语言符号的句法信息。HEAD 是其中最重要的一个属性,主要描述符号的词类(part of speech) 。FORM 表示符号的词形特征,此处“fin”表示该动词是“定式动词(finite) ” 。 2.3 关于 SEM SEM 用来描述语言符号的语义信息。HPSG 把句法和语义有机地结合在一起,在对符号的描述中包含了丰富的语义信息。HPSG 主要借鉴了情景语义学(situation semantics)的研究成果,其语义描写的目的是想说明:在一个事件中,谁对谁做了什么(who did what to whom) ,发生在什么时间、什么地点等。对一个符号的语义描写主要

11、包括三个部分: (3) MODE INDEX RESTR MODE 有五个备选的属性值:prop(陈述) 、ques(疑问) 、dir(祈使) 、ref(指称)和 none。 例如,动词的 MODE 值是 prop,名词的 MODE 值是 ref。冠词、介词、连词等不能表达陈述、疑问、祈使和指称的概念,其 MODE 值是 none。INDEX 对应于所描述的情景(situation)或事件(event) 。例如,在(1)的描述中, “give”传达了一个代号为 s 的事件。RESTR 指的是事件成立必须满足的一些条件(conditions) 。例如, “give”这一事件成立必须满足这样的条件

12、:情景 s 中 i 把 k 给了 j,发生的时间是现在,i、j、k 分别和 give 的不同语义角色(roles)相联系。 42.4 关于 ARG-ST ARG-ST(ARGUMENT-STRUCTURE)用来描述语言符号的论元结构。它是一个属性特征列表,对动词而言,包含与动词共现的所有必需论元(arguments) ,是该动词的指定语(SPR) 和补足语(COMPS)之和;对名词而言,主要是该名词的指定语(SPR) 。例如,(1)中 give 的ARG-ST 是 NPi , NPj , NPk ,意思是它需要一个主语和两个补足语(一个间接宾语和一个直接宾语)与其共现。在ARG-ST中,论元的

13、排列次序和实际句子中的次序是相吻合的: “Mary(NPi) gives me(NPj )a book(NPk )” 。NPi 是 NP SEM INDEX i 的省写, NPj 、 NPk 类似。 NPi 、 NPj 、 NPk 分别对应于 RESTR 中的 GIVER、 GIVEN 和 GIFT,这样, give 的句法结构和语义特征就有机地联系起来了。 有时, 可以不用论元结构 ARG-ST 而分别用指定语 SPR 和补足语 COMPS 来描述,例如对“give” : (4) word verb HEAD give, SYN FORM fin SPR NPi COMPS NPj , NP

14、k 2.5 特征结构是一个严密组织的体系 特征结构是经过分类排序的 (be sorted) 。首先,每一个类都有自己独特的特征值,不同的类要求不同的特征值。例如,SEM、SYN是不同的类 (sort)3,SEM 要求 MODE、INDEX、RESTR 作为它的值,而SYN 要求 HEAD 作为它的值的一部分。再者,类是一个有层级的体系结构。 例如, PHON 和 SYNSEM 是 sign 的下层类 (subsort) , HEAD 是 SYN 的下层类。 2.6 一点说明 对一个符号的特征结构描述并不一定要求是完全的,可以根据需要择其相关,事实上,3 “sort” 的概念和下文的“type”

15、是一样的,都相当于汉语中的“类” 。 “typed feature structure”和 “sorted feature structure”也基本上是一样的,都是“类特征结构” 。 5本文的特征结构描述都是不完全的。HPSG 的特征结构异常复杂,本节介绍的只是其中主要的部分,下面我们将根据需要随文再介绍一些。 3. 3. HPSG 的词汇 的词汇 HPSG 把语法描写的重担转移到了词汇上,一个词语将不得不承担太多的句法和语义信息,这样词汇系统将不可避免地变得冗余和繁琐。HPSG 利用两个策略成功地解决了这一难题:词汇类体系结构(type hierarchy)和词汇规则 (lexical rules) 。 3.1 词汇类体系结构 HPSG 采用了类特征结构(Typed Feature Structure) 。语言中的不同实体语音、词、短语、句子等都是不同的“类(type) ” ,分别要求不同的属性特征与其相对应。语言中客观存在一个词汇类体系结构。 3.1.1 上层类(supertype)和下层类(subtype) 如果 T2 是 T1 的下层类,那么:a、 适合于T1 的每一个特征同样适合于T2 ; b、 与 T1 相关的每一个约束4都影响到 T2 的实例(instanc

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 初中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号