自然语言合理句子的生成系统

上传人:新** 文档编号:559209473 上传时间:2024-02-14 格式:DOC 页数:23 大小:1.35MB
返回 下载 相关 举报
自然语言合理句子的生成系统_第1页
第1页 / 共23页
自然语言合理句子的生成系统_第2页
第2页 / 共23页
自然语言合理句子的生成系统_第3页
第3页 / 共23页
自然语言合理句子的生成系统_第4页
第4页 / 共23页
自然语言合理句子的生成系统_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《自然语言合理句子的生成系统》由会员分享,可在线阅读,更多相关《自然语言合理句子的生成系统(23页珍藏版)》请在金锄头文库上搜索。

1、自然语言合理句子的生成系统 胡玥1,,高小宇2,1,李莉,高庆狮1,北京科技大学信息工程学院 北京00832中国科学院计算技术研究所 北京10080摘要基于自然语言语法规则由sky的上下文无关文法所生成的句子是合法,适合语法规则,但是不一定合理。本文提出的新生成系统所生成的句子是合法又合理。其特点是基于语言单元理论的和具有数以百万计生成规则的而不是数千个,和使用Chomsky的短语文法而不是上下文无关文法。也就是,比较精确描述自然语言的文法必须是短语文法,及基于语义单元理论百万计的生成式集。“合理”的核心是基于语义单元理论,引入了“类型参量”。类型参量不仅出目前语义单元集B-I 中,并且还出目

2、前类型-树C-eeI 上,核心词:多自然语言,生成系统,语义单元,语义语言,多语言机器翻译AGenerting Sytemto Generate LegtmateandResonabe Sentns 本研究工作得到 863筹划( No. AA01Z140 和 No. AA010101)的资助,和国家自然科学基金( No. 60873002和GJZRJJ-60736013)的资助。Hu Yue1,2 1,2,Gao Xiy 2,1, Li1, ao Qingsh ScoolofIfomaton gineerg,Univrsty f cience & TchologyBejin,Beijing,1

3、032Intt o omng Tchnlogy, th hinese Academy of Scinces,Bijig,10080AbsrctTh sentences prce Comsys ntex-ree Grammar arelegtimae, conformwith sn rul, uno reasonle he sentences prduced bnewgnrtingysm aelegitimateand eaonale.Iseatur s at, sd on semantic unit hory a ht the nmerofrulesseveral millons, rah t

4、han sveral tousnd, and y ra-structureramma raher tan by Conex-fee Grmar,e. grammar odscribe more xaty natural language mustbe hrse-structure Gar, and itsproducions ar bd onemati nit hory. Theky freaonabnesi based n mntic-units theory,to intrc th gr-paamee syste, which is in te set B-RIS, n te se C-r

5、ee, and intese FI. Chomsks PraeuctureGrammayord: muiple natalnges,gnatigsse, sac ni,semanic language, muliple languesmachine tanation 引言 NCmsky 形式文法理论 N. Chosk1在15年提出形式文法理论,抱负的形式化的描述工具之一。不仅对语言学,并且对整个计算机科学做出了很重要的奉献。 但是,基于语法的Chmsky文法生成的句子可以是合法的但不一定是合理的。由于生成规则只反映语法规则,不能有效反映语义,要生成既合法又合理的句子就成为不也许的。 JJ. K

6、at的语义标式(tic maker) J. Kat 的语义标式2相称于语素分析体现式,是建立在词-词组句,词的义素(semnteme)”,和“句子的语义是句子中词义总和”的老式思想的基本上,虽然有较好的递归原则(rcrive prinie)的思想,但是仍然没有成功。C. Flor的格文法(agamma)C.J. llor菲尔墨的格文法3 反映了句子各语义成分之间的本质语义关系。这些本质语义关系独立于具体的自然语言语种。从动词的“配价”理论到“语义单元”理论 法国语言学家 L.esnire早在2世纪50年代末从构造句法(Sratural Sytx)的角度,提出的以动词为句子中心的配价语法4,是语

7、言学上的重要奉献。其中,动词的价是指该动词支配名词性成分的数目。而在20世纪80年代提出的带类型参量的语义单元理论5-11具有如下特点:(1)。动作类型的语义单元的参量不限制是名词类型,可以是形容词、数词、副词、句子或者简化的句子等等类型;(2)。数目也不是限制在三个或者三个如下,可以是四个或者超过四个。(3)。特别重要的是,一种或者多种实量(每个实量是指一种或者多种字串)和一种或者多种虚量(每个虚量是指一种或者多种类型参量之“或”)是融合成为一体,不可分隔。也就是,不仅限于动词与其有关的名词(及其她词)之间的语法上的依存关系,而是所有实量、虚量融成为一体,形成一种独立语义的语言单位,称为该自

8、然语言上的语义单元表达。(4)。其中,实量不仅限于动词,还涉及有关的词(例如,介词、冠词、副词、助词,等等)。(5)。句子就是“语义单元表达”中的类型参量不断地被该类型的其她语义单元表达所代入,直到所有都是实量。()。“语义单元表达”的语义就是意义单位(unt ofmaning),称为“语义单元”(smntui)。(7)。更重要的是:语义单元与它在各个自然语言(例如,英、汉、日、等等)的语义单元原则表达repesenation是一一相应的。()。并且它在各个自然语言的表达中,实量的个数和实量、虚量的位置(lace)是可以各不相似。例如,一种语义单元的英语表达“ cosists of oun”,

9、其相应的汉语的语义单元表达是“是由构成”。如下一方面在第2节讨论自然语言合法且合理的统毕生成系统,所波及有关的内容将分别在其后的第3节到第节中讨论。 一种自然语言合法且合理的句子生成系统LRSGS生成自然语言的合法并且合理句子的生成系统LRSGS是建立在语义单元及其表达理论上的一种0型形式系统GI =, N, , PI,=1,其中,TI 是在I-自然语言上的终结符集。 是非终结符集,对所有的自然语言都同样。S是初始符,SN,对所有的自然语言都同样。 PI 是生成式集 abI,其中,aI,bI(TN)*,即集合T 上的字串。(参第7节) 为了以便理解生成系统LRS,GI可以改写为I:I TI,

10、N, B, C, , FI, PI ,=,.其中,TI 是在I-自然语言上的终结符集。N 是非终结符集,对所有的自然语言都同样。S是初始符,SN,对所有的自然语言都同样。BIB-RIU是I-自然语言上的带类型(category)参量或者不带类型参量的基本语义单元表达集。其中,类型参量是非终结符或者非终结符的“逻辑或”,其她部分是I-自然语言上的终结符串。(参第节)CIC-treeI 是I-自然语言上的句树与事物树,通称为类型树。在I-自然语言上类型树上的所有的叶节点是I-自然语言上的基本语义单元表达 -RISU;所有在I-自然语言上的类型-树的非叶节点是由基本语义单元表达的类型所构成的类型节点

11、,对所有的I-自然语言都同样。(参第4、5、6节)F是I-自然语言上的函数集I(XI),其中, X,F(X)(IN)* ,即集合N上的字串。(参第6节) 是I自然语言上的生成式集 aIbI,其中,a,bI(TI)*,即集合T 上的字串。(参第节) 3. 语义单元与语义体现式5123.1 基本语义单元(B-SU)及其在自然语言上的表达(B-RIU) 不同的K(K1)种自然语言(例如,英语、汉语、日语、)的句子之间的之因此互相翻译,是由于这些相应的句子之间有相似“意思”(即语义)。我们称句子的语义为“句义”,称句子为其句义在该自然语言I上的表达(即句义表达,记作为RSS)。在K个不同的自然语言中表

12、达相似句义的句子中,体现相似“意思”(即语义)的单元称作为“语义单元表达”(记作为RISU);该“意思”(即语义)被称作为“语义单元”(记作为SU)。显然句义是语义单元,句子是语义单元表达。语义单元表达可以是:所有由在I-自然语言上的终结符集TI 上的字(称作为实量l-parmeter)构成,即,简朴语义单元表达(记作为S-RSU);也可以由终结符集TI 上的字(实量)和由非终结符集N元素表达的类型参量(Type arameter,称为虚量psud-parametr,)所构成,称为一般语义单元表达;还可以只由虚量所构成,称为抽象语义单元表达。简朴语义单元表达是不带类型变量的语义单元表达,一般语

13、义单元表达和抽象语义单元表达是带类型变量的语义单元表达。.2句义体现式句义体现式(记作为SS-e)就是用基本语义单元通过代入形成的句义。-自然语言上的句子体现式(记作为Iep)就是用基本语义单元表达通过代入形成的句子。显然,S-p是RU-exp。例如,句子-1:“Mr. Smih is annginer”(英语)“史密斯先生是工程师”(汉语) “技师”(日语)。其在英语上的句子体现式 SE-exp是“M.Sithisan enginer”;其在汉语上的句子体现式S-ep 是“史密斯先生是工程师”;其在日语上的句子体现式SJxp 是“技师”。其句义体现式是“(2(4),3) ”,即SS-ep=1(2(4),3)。其中,是mih相应的语义单元;是enie相应的语义单元;2( ”相应的语义单元;1(,)是“是表达具有职称的人的名词”相应的语义单元。(参表.)表1。语义单元及其在自然语言上的表达基本语义单元1(,)2()4语义单元英语表达表达人的名词 aMr. 姓名|姓|名Smitnee语义单元汉语表达表达人

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号