面向自然语言信息处理的维吾尔语名词形态分析研究

上传人:飞*** 文档编号:23274450 上传时间:2017-11-30 格式:DOC 页数:9 大小:37.53KB
返回 下载 相关 举报
面向自然语言信息处理的维吾尔语名词形态分析研究_第1页
第1页 / 共9页
面向自然语言信息处理的维吾尔语名词形态分析研究_第2页
第2页 / 共9页
面向自然语言信息处理的维吾尔语名词形态分析研究_第3页
第3页 / 共9页
面向自然语言信息处理的维吾尔语名词形态分析研究_第4页
第4页 / 共9页
面向自然语言信息处理的维吾尔语名词形态分析研究_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《面向自然语言信息处理的维吾尔语名词形态分析研究》由会员分享,可在线阅读,更多相关《面向自然语言信息处理的维吾尔语名词形态分析研究(9页珍藏版)》请在金锄头文库上搜索。

1、面向自然语言信息处理的维吾尔语名词形态分析研究面向自然语言信息处理的维吾尔语名词形态分析研究2010-11-09面向自然语言信息处理的维吾尔语名词形态分析研究阿依克孜.卡德尔开沙尔.卡德尔吐尔根.依布拉音,新强大学。人文学院,乌咨木齐胜利路14号830046);,新强大学,信息科学与工程学院,乌鲁木齐胜利路14号830046)E-mail:摘要本文对维吾尔语名词的形态变化名词的数、人称、格等语法范畴进行了形式化的描述和分析,指出了维吾尔语名词的苏本形态参数并总结了参数的组配规律,统计了及其类型,为维吾尔语信.息处理中的名词形态处理提供了有益的方法和思路.关键词维吾尔语信息处理;名词;形态引言维

2、吾尔语是一种形态发达的粘着语,各词类一般都具有一定的语法范畴,主要表现形式是形态变化。也就是说每一个词在生语料中以不同的形态出现,这主要表现为词干上按照一定的循序缀接不同的词尾。举名词til(语言为例恤il milletnig muhim alahidiliklirinitbiri.(语言是民族的重要特征之一。OOu川Xil tilda rawan sezl承坷du.(他能用三种语言流利地交流.)以上例句中til以原形单数、主格形式出现,表示til是逻辑和语法主体例句中til以原形附加词尾da的形式出现,其中da是时位格词尾,这里表示动作的工具。因此在维吾尔语信息处理中,形态分析问题,尤其是名

3、词、动词等基本实词的形态分析是一个很重要的问题。着眼于这一问题,在此我们首先将分析维吾尔语名词语法范畴这里指的是形态范畴及其形态变化规律。1维吾尔语名词形态分析的必要性在所有的语言中,名词是最基本的实词之一,再说维吾尔语名词的形态变化非常丰富。很有必要仔细分析,深入研究。1.1从第一语言习得的角度看第一语言习得的研究表明,在儿童早期的习得过程中,首先习得的基本单位是一些未经形态变化的单词,然后慢慢再习得语言能力中的语法规则。因此一个两岁大的小孩会说:apa keldi(妈妈来了。),men时ketimen(我要回家。)这样的形态变化不完整的句子。实际上,上述例句中的apa(妈妈)应该发生形态变

4、化,词干上应该缀接人称词尾m.表示说话者的妈妈。0i(家)的词干上应该缀接向格词尾ge,表示行为的趋向。这说明了人的语言知识中,尤其是形态丰富的维吾尔语语言知识中,名词的形态问题也占据相当重要的地位。1.2从第二语言习得的角度看如果说名词的形态对于操维吾尔语者的问题主要限于书面语范围的话,那么它对于第二语言学习者来说。问题就会普遍得多、严重得多。对操母语者来说十分简单的形态变化,哪怕是三岁孩子也不会发生错误,但却经常使第二语言学习者,尤其是那些母语是缺乏形态变化的分析性语言的第二语言学习者错误百出。第二语言学习者往往根据自己母语的语法规则,按照词对词翻译的方式造出目标语中的组合形式,而这些组合

5、形式往往在目标语中是不符合语法规则的.比如汉语的:明天乌鲁木齐晴,有时多云,在维吾尔语中应该用ete yrymtfide hawa of和qbezide bulutluq bolidu表达。其中yrymtfide是名词乌鲁木齐的时位格形式,表示处所,在这里可不能用名词原形yrymtfi可见对于第二语言学习者来说,习得形态丰富的维吾尔语时必须重视名词的形态。1.3从自然语言处理的角度看1.3.1自然语言理解自然语言理解是知识信息中的核心问题。由于维吾尔语是典型的粘着语,名词的形态由不同的词尾的不同的组配构成,所以名词的形态分析是维吾尔语言理解中的难点之一。如果总结出维吾尔语名词的形态规则,井统计

6、出名词词尾的组配类型,就有助于理解同一名词的不同形式并把它们归结为原形上。比如.可以弄清kitaptin(从书上,kitapni(把书,kitaplar(一些书)都是kitap(书)一词的不同形态,只不过附加意义上有所区别。1.3.2语言生成总结出维吾尔语名词的形态规则,并统计出名词词尾的组配类型之后,按照词尾的组配及其缀接规则,可以生成同一名词的不同形式,使用于语句的准确输出。比如,按照规则级接词尾,从可房子、家)一词一般最多可以生成120多种可使用的形式见以下维吾尔语名词形态参数组配例表1.3.3机器翻译名词的形态分析,对机器翻译非常重要,因为机译系统的核心是分析、转换和生成.只要仔细分析

7、维吾尔语各词类的形态规则,才能解决目标语言和原语言之间的形态转换问题,其中名词是首先要处理好的词类之一。2维吾尔语名词的语法范畴维吾尔语的名词有数、人称、格等语法范畴.由于这里的研究是面向计算机的,形式化的描述当然是必要的10,所以下面我们将对维吾尔语名词的数、人称、格等语法范畴尽可能地进行形式化的描述,为此设置了以下形态参数N(noun)=名词n(number)=(复数词尾p(person)=人称词尾c(case)二格词尾2.1数范畴维吾尔语名词的是通过名词的形态变化表示事物的数量的语法范畴,表达的概念包括单数和复数两类。名词的原形就是名词的单数形式,其复数形式是在名词词干上缀接构形词尾构成

8、,词尾的形态参数如下n=复数词尾lar/ler比如单数无词尾复数kitap(书)kitap十lar-+kitaplar(表示一个以上的书adem(人)adem+ler,ademler(表示一个以上人名词的复数词尾是第一个加在词干上的词尾。2.2人称范畴维吾尔语名词的领属性人称范畴是通过名词的形态变化表示名词所指事物的领属关系的语法范畴。表达的概念包括第一人称单数、复数。第二人称单数、复数和第三人称形式上不分单复数)121:词尾的基本形态参数如下Pi=第一人称单数n3/im/um/ym(Pli,PI2,PI3,Pw)P2二第一人称复数miZlimiZ(P21,P22)P3=第二人称单数。/ig/

9、ug/yg向iz印3 bP32,P33,P34,P35)P4=第二人称复glar/iglarluglar/yglar(p41,P42,P43,P44)P5=第三人称单、复数i485比如kitap十33nkitapim(我的书)kitap+imiz.kitapimiz(我们的书kitap+ig-+kitapig(你的书)kitap+iglar.kitapiglar(你们的书O kitap+i-;kitapi(他的书或他们的书人称词尾单独绷接名词时,直接附加在名词词干上,如果与其他词尾同时出现,就要附加在复数词尾后,也就是说附加在第二层。比如kitap十imkitapimkitap+lar十如、k

10、itaplirim(这里的元音弱化规则下面再解释2.3格范畴维吾尔语名词的格指的是形态格,是通过名词的形态变化表示名词与其他词之间的主要是名词与动词之间的各种关系的语法范畴。维吾尔语中有主格主要表示动作的主体、属格表示领属关系、宾格表示动作与客体的关系、向格主要表示行为动作的趋向、从格表示行为动作的起点或来源、时位格主要表示行为动作的发生,存在的时间或空间,还可以表示工具、界限格表示行为状态所持续的时间界限和空间界限、范围格、相似格、和量似格十种i31,词尾的基本形态参数如下主格0(无词尾c1=属格nig C2=宾格ni C3=向格3sa/qa/ge/ke(C31,C32,C33,C34)c4

11、=从格din/tin(C41,C42)CS=时位格da/de/ta/te(CS1,CS2,CS3,CS4)C6=界限格Xitf e/gitf e/gitf e/kitf e(C61,C62,C6),C64)C7=范围格diki/tiki(C76C72,)Cg=相似格dek/tek(cgi,cs2,)Cg=量似格tfe/tfilik(C91,C92,)比如或keldi(主云到了。主格u akamnin oisli.(他是我互互放儿子。属格men kitapm taptim.(我把上找到了。宾格akamlsa Xet jazdim.(我竺至里写信了。向格jurttin tusganlar keld

12、i.(丛麦鑫来T几个亲戚。从格bir kyn o)d_e olturdum(我整天都立室里。时位格sahipXan mihmanlami iikkit euzitip tf igti(主人二携吹赛人i到且旦。界限格bu teXse biznig&iki teXsidin tjirajligken.(这盘子比我们室放盘子好看。范围格bu giznig megzi almidek qipqizil.(这女孩的面颊红得基主里翅放.)相似格akigiztf ilik birsi izdep keptiken(年龄且迩互且羞工主的一个人来找过你。量似格维吾尔语名词的格词尾单独级接名词时缀接,直接附加在词

13、干上,与其他一种或两种词尾同时名词时,要附加在最外层。比如qol+ni,qol+ni(把手单数qo+lum+ni,golumni(把我的手单数qol+lar+ni、gollami(把手复数qol+lar+im十ni,qollirimni(把我的手复数2.4维吾尔语名词的形态规则维吾尔语名词的形态变化收一些特定的规律的限制.所以基本上可以总结出以下规则。2.4.1层次规则486维吾尔语词的结构也和其他语言单位的结构一样,具有层次性。名词的词尾也按照一定的层次缀接词干。这可以用树性结构表示比如Nnpc qollirimni qolum/、/、/、Nnp cqollirim ni golum 0/、

14、/、/、Nn pqollar im qol um/、/、了、N nqol lar qol 0最外面一层的是格词尾,其次是人称词尾,最里层的是复数词尾。2.4.2形态音位变化规则词干与词尾的组配过程中,会发生一些形态音位变化。这主要表现在以下几点上l.词干对词尾的元音和谐选择。比如elem+im,yzy.十ym(im或Ym的选择2复数词尾中的元音弱化。比如:qol+lar+im十ni-qollirimni(其中lar变为fir)3.词千中的元音弱化比如:bala+si-balisi(其中词干的a弱化为i0)4.词干与词尾之间增加音位。比如:sija+im-sijajim(词干与词尾之间增加了音位,j;)因为篇幅有限,在此省去了形态音位变化规则的具体描写2.4.3对词尾的语义选择规则按照表达语义的要求,词尾类型中有一个词尾会被选择。比如,从PI,P2,P3,P4,P,中选择一个,从。I,C2,C3,C4,C3,C6,C7,C8,C9中选择一个其中在形态音位变化规则选择按照音位变体,就这样通过不同词尾的不同组配产生名词的各种形态。按照具体的分析,一个维吾尔语名词按照以上规则一般可生成最多120种形式当然有些名词受语义选择规则的限止生成的形式达不到120种。具体分析如下历史上的今天:研究生小岛康奖学金申请书2010-11-09

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号