文档详情

自然语言形式分析的奠基力作

ji****81
实名认证
店铺
DOCX
302.41KB
约27页
文档ID:236130047
自然语言形式分析的奠基力作_第1页
1/27

    自然语言形式分析的奠基力作    冯志伟 周建摘  要:1957年,乔姆斯基《句法结构》出版,这是对结构主义的一系列基本原理提出的挑战,是自然语言形式分析的奠基力作,标志着语言学中的“乔姆斯基革命”的开始此书着重阐述了形式语言理论和转换语法在形式语言理论中,乔姆斯基将语言看成是一个抽象的数学系统为了描写和解释语言现象,他论证了语法的生成能力,认为应该把语法看成是能生成无限句子的有限规则系统在转换语法中,乔姆斯基认为,转换语法模型由直接成分层级、转换层级、语素音位层级三个层级构成在运用转换规则时,具体的操作方式主要有调位、复写、插入、消去,转换使语法具有更强的解释力关键词:乔姆斯基;《句法结构》;形式语言理论;转换语法如果说,索绪尔语言学说的提出是语言学史上哥白尼式的革命,那么,乔姆斯基(N.Chomsky,1928— )的转换生成语法的提出,则是语言学史上的又一次划时代的革命,即“乔姆斯基革命”1916年索绪尔《普通语言学教程》的出版,开辟了现代语言学的新纪元,而1957年乔姆斯基《句法结构》的出版(Chomsky,1957),是对结构主义的一系列基本原理提出的挑战,标志着语言学中的“乔姆斯基革命”的开始。

这场革命直到今天还没有完结(冯志伟,1982)《句法结构》一书出版已经60年了,这是一本对于现代语言学有重要影响的著作,也是自然语言形式分析的奠基力作,特写此文以志纪念一、乔姆斯基与《句法结构》1928年12月7日,乔姆斯基出生于美国费城他的父亲威廉· 乔姆斯基(William Chomsky)是一个希伯来语学者,曾写过《大卫·金西的希伯来语法》(Davis Kimhis Hebrew grammar)一文幼年的乔姆斯基(他的名字叫诺阿姆,即Noam Chomsky)在父亲的熏陶下,就爱上了语言研究工作1947年,他结识了美国描写语言学“后布龙菲尔德学派”的代表人物、著名语言学家海里斯(Z.Harris,1909—1992)在研读了海里斯《结构语言学方法》(Method in Structural Linguistics)之后,他被海里斯那种严密的研究方法深深地吸引住,几乎到了心醉神迷的程度从此,他立志以语言学作为自己毕生的事业,进入海里斯执教的宾夕法尼亚大学,专攻语言学乔姆斯基是熟悉希伯来语的,掌握了《结构语言学方法》的基本原理之后,他试图用海里斯的方法来研究希伯来语,但所获甚微于是,他决定把海里斯的方法作适当的调整,建立一种形式语言理论,采用递归的规则来描写句子的形式结构,从而使语法获得较强的解释力。

从1947年到1953年,乔姆斯基花了整整六年时间来从事这项研究其间,1949年在巴尔希列尔(Y.Bar-Hillel,1915—1975)的鼓励和支持下,提出了一套描写语言潜在形态的规则系统1951年在宾夕法尼亚大学完成了硕士论文《现代希伯来语语素音位学》1951年后,他到哈佛大学学术协会任职,以正式会员的身份从事语言研究工作1953年,他在《符号逻辑杂志》(Journal of Symbolic Logic)上发表了《句法分析系统》(System of Syntactic Analysis),此文对美国描写语言学的方法进行了形式化描述他感到,在结构主义的框架中研究语言,往往会得出错误的结论为了完成形式语言理论这一有意义的课题,在海里斯的建议下,乔姆斯基从1953年开始学习哲学、逻辑学和现代数学这个时期,他受到了古德斯曼(N.Goodsman)的“构造分析法”的影响,也受到了奎恩(W.V.O.Quine)对逻辑学中的经验主义批判的影响,他采用的语言研究方法是严格的、形式化的同时,他对美国描写语言学的方法越来越不满意,在哈勒(M.Halle)的支持下,乔姆斯基决心同结构主義思想彻底决裂,另起炉灶,走自己的新路。

1954年,乔姆斯基着手撰写《语言理论的逻辑结构》(The Logical Structure of Linguistic Theory)一书在这部著作中,他初步勾画出生成语法的理论观点和思想方法1955年,《语言理论的逻辑结构》(Chomsky,1975)书稿完成,乔姆斯基回到宾夕法尼亚大学,并以论文《转换分析》(Transformational analysis)获得了博士学位1955年秋,乔姆斯基经哈勒和雅可布逊推荐,到麻省理工学院(MIT)电子学研究室做研究工作,并在现代语言学系任教,给研究生讲授语言学、逻辑学、语言哲学等课程麻省理工学院电子学研究室在著名学者魏斯奈尔(Jerome Wiesner)的领导下,为多学科的联合研究提供了良好的环境,这样,乔姆斯基就可以专心致志地从事自己的研究工作这时,乔姆斯基的形式语言理论的思想已基本成熟,他更加清晰地认识到结构主义的方向是完全错误的,他开始大胆地向结构主义挑战1956年,在哈勒的建议下,乔姆斯基把自己在麻省理工学院给本科生讲课的一些笔记,交给了荷兰摩顿(Mouton)公司的《语言学丛书》(Janua Linguarum)的编辑舒纳费尔德(C.V.Schoonefeld)。

舒纳费尔德独具慧眼,答应出版这些笔记经过一番修改之后,由摩顿公司在1957年以《句法结构》(Syntactic Structures)为题出版此书的出版,得到了美国陆军通讯兵团,美国空军科学研究署、空军研究部、空军开发部和美国海军研究署的资助,还得到了美国国家科学基金会和伊斯特曼·柯达公司的资助可见美国海陆空三军以及美国国家基金会对此书的重视从此,乔姆斯基的语言学说开始在语言学界传播开来,并进一步发展成为众所周知的转换生成语法(transformational generative grammar)2002年,德国德古意特公司(De Gruyter GmbH&Co.KG)出版了《句法结构》的第二版(Chomsky,2002)可以说,《句法结构》是自然语言形式分析的奠基性著作,对于现代语言学的发展具有重要的意义在撰写《句法结构》前后,乔姆斯基还在1956年至1963年间,发表了《语言描写的三个模型》(Chomsky,1956)、《论语法的一些形式特性》(Chomsky,1959)、《上下文无关语法和后进先出存储器》(Chomsky, 1962)和《语法的形式特性》(Chomsky,1963)等论文。

本文也结合这些论文来分析《句法结构》,这样将有助于我们更加深入地理解《句法结构》的内容二、形式语言理论乔姆斯基在《句法结构》中,以语言学家可以理解的方式介绍了他的形式语言理论(formal language theory)和转换语法(transformational grammar)一)语法生成的方法形式语言理论的研究对象,除了自然语言之外,还包括程序语言和其他人造语言在形式语言理论中,语言(Language)被看成是一个抽象的数学系统,乔姆斯基把它定义为:按一定规律构成的句子(Sentence)或符号串(String)的有限的或无限的集合,记为L每个句子或符号串的长度是有限的,它们由有限数目的符号相互毗连而构成构成语言的有限个符号的集合,叫做字母表 (alphabet)或词汇 (Vocabulary),记为V;不包含任何符号的符号串,叫做空句子(empty Sentence)或空符号串(empty String),记为ε如果V是一个字母表,那么,把由V中的符号构成的全部句子(包括空句子ε)的集合,记为V*,而把V中除了ε之外的一切句子的集合,记为V+例如,如果V={a,b},则V*={ε,a,b,aa,ab,ba,bb,aaa,…}V+={a,b,aa,ab,bd,bb,aaa,…}但是,某语言的字母表V中的符号相互毗连而成的符号串,并不一定都是该语言中的句子。

例如,“the boy hit the ball”在英语中是正确的,叫做“成立句子”;而由同样符号构成的“*the hit the boy hall”在英语中却是不正确的,叫做“不成立句子”为了区别一种语言中的成立句子和不成立句子,就有必要把这种语言刻画出来,从而说明在这一种语言中,什么样的句子是成立的,什么样的句子是不成立的乔姆斯基认为,可以采用三种办法来刻画语言第一种,穷尽枚举法,即把语言中的全部成立句子穷尽地枚举出来如果语言只包含有限数目的句子,要穷尽地枚举是能办到的;而如果语言中句子数目是无限的,用简单枚举的办法就行不通而且,在很多场合,对于语言中某一个长度有限的句子,还可以采用一定的办法将其长度加以扩展例如,对于英语句子This is the man.(这是那个男人我们可以将其扩展为:This is the man that married the girl.(这是那个同姑娘结婚的男人还可以进一步扩展为:This is the man that married the girl that brought some bread.(這是那个和带来了一些面包的姑娘结婚的男人乔姆斯基认为,可以在句子里加上任意数目的that-从句,每加一个这样的从句就构成了一个新的更长的句子,而这些句子都是成立的。

究竟能加多少个that-从句,只与讲话人的记忆力及耐心有关,而与语言本身的结构无关从这个意义上说,人们能够加上无限数目的that-从句而使句子保持成立在这样的情况下,用穷尽枚举的办法来刻画语言显然是行不通的第二种,语法生成法,即制定有限数目的规则来生成(generate)语言中无限数目的句子例如,上面三个句子可以这样统一地加以描述:设X是一个初始符号,S为句子,R为that-从句,提出重写规则:X→SS→S︵R这里,“→”是重写符号, “︵”是毗连符号,利用这两条规则,可以生成数目无限的带that-从句的句子乔姆斯基把这些数目有限的刻画语言的规则,叫做“语法”(grammar),记为G语法是有限规则的集合,这些规则递归地生成潜在的无限的句子,并排除语言中的不成立句子语法G所刻画的语言,记为L(G)需要注意的是,乔姆斯基在这里所说的“语法”,与一般语言学书中所说的“语法”不是一回事,它有着如上所述的特定的含义乔姆斯基指出,早在19世纪初,德国杰出的语言学家和人文学者洪堡特(W.V.Humboldt,1767—1835)就观察到“语言是有限手段的无限运用”但是,由于当时尚未找到能揭示这种观点的本质内容的技术工具和方法,洪堡特的论断还是不成熟的。

那么,究竟如何来理解语言是有限手段的无限运用呢?乔姆斯基认为,“一个人的语言知识是以某种方式体现在人脑这个有限的机体之中的,因此语言知识就是一个由某种规则和原则构成的有限系统但是一个会说话的人却能讲出并理解他从未听到过的句子以及和我们听到的不十分相似的句子而且,这种能力是无限的如果不受时间和注意力的限制,那么由一个人所获得的知识系统规定了特定形式、结构和意义的句子的数目也将是无限的不难看到这种能力在正常的人类生活中得到自由的运用我们在日常生活中所使用和理解的句子范围是极大的,无论就其实际情况而言还是为了理论描写上的需要,我们完全有理由认为人们使用和理解的句子范围都是无限的Chomsky,1982)递归是体现“有限手段的无限运用”的最好办法乔姆斯基提出的“语法”就恰恰采用了递归的办法第三种,自动机识别法,即提出一种装置来检验输入符号串,用这种装置来识别该符号串是不是语言L中的成立句子如果是成立句子,这个装置就接收它;如果是不成立句子,这个装置就不接收它乔姆斯基把这样的装置叫做“自动机”(automata),它是语言的“识别程序”(recognizer),记为R由此可见,刻画某类语言的有效手段,是语法和“自动机”。

下载提示
相似文档
正为您匹配相似的精品文档