语料库建设和应用

上传人:工**** 文档编号:569267915 上传时间:2024-07-28 格式:PPT 页数:34 大小:349.50KB
返回 下载 相关 举报
语料库建设和应用_第1页
第1页 / 共34页
语料库建设和应用_第2页
第2页 / 共34页
语料库建设和应用_第3页
第3页 / 共34页
语料库建设和应用_第4页
第4页 / 共34页
语料库建设和应用_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《语料库建设和应用》由会员分享,可在线阅读,更多相关《语料库建设和应用(34页珍藏版)》请在金锄头文库上搜索。

1、帝砒嗓勘庆竖忆萍逮色鞘蚌拂癣颂惊劈亭杆炉助损妮俐向折壶赦容豌改铆语料库建设和应用语料库建设和应用语料库的建设和应用语料库的建设和应用桂诗春烁革棺员涛慑石司抽啄刨缴泰吠劫独端驱蓉耀戴友淫波酸倡往咯躁串渴勋语料库建设和应用语料库建设和应用1.语料库的兴起语料库的兴起v发祥地语料库语言学首先在美国。 60年代开始年代开始,美国建立了美国建立了100万词的万词的Brown语料库语料库(Francis & Kucera)。同时同时, 英国英国Edinburgh大学的大学的300,000词的口语语料库。词的口语语料库。但是在但是在generative linguistics的影响下,得不到很多发展,例如的

2、影响下,得不到很多发展,例如Lees认为认为Francis是是”That is a complete waste of your time and the governments money, You are a native speaker of English; in ten minutes you can produce more illustrations of any point in English grammar than you will find in many millions of words of random text.”Sinclair认为,原因是认为,原因是“th

3、e dominant attitude to language in USA over forty years has been concerned with language in the mind, and not language on paper, or in the air”.在英国和欧洲却得到迅猛的发展,在英国和欧洲却得到迅猛的发展,ICAME(International Computer Archive of Modern English)在挪威的建立。在挪威的建立。美国人开始觉醒,美国人开始觉醒, 1999在在Michigan召开了召开了”北美语料库语言学讨论会。北美语料库语言

4、学讨论会。Simpson和和Swales在论文集呼吁要像人造卫星和汽车工业那样迎头赶上。在论文集呼吁要像人造卫星和汽车工业那样迎头赶上。ANC正在积极进行,正在积极进行,LDC(Linguistic Data Consortium)收集了许多语料。)收集了许多语料。LDC的口号是的口号是No data like more data。 咆凡屯健喧岸失崖楚较普离斟放枝方冀贡需髓颖频逝鞭妆营短更放耿壶辫语料库建设和应用语料库建设和应用1.语料库的兴起语料库的兴起vBC (before computers)前:100多年前多年前, Wilhelm Kaeding 动员了动员了”an army of h

5、elpers”(5000人)建立了一个人)建立了一个1千千1百万词的德语语料库来研究速百万词的德语语料库来研究速写写 (Hausser 1998)。 18世纪世纪Dr Johnson based 编写英语词典引用了来自著名作家的编写英语词典引用了来自著名作家的150,000例句。例句。Palmer对常用词的研究。对常用词的研究。Thorndike的工作(包括编写词典和编写的工作(包括编写词典和编写3万常用词表。万常用词表。(1944)Hornby的的Advanced Learners Dictionary of Current English.(1948) West的的General Serv

6、ice List of English Words(1953)Quick在在50年代开始调查英语习惯语用法年代开始调查英语习惯语用法(SEU)(1968)。冀频柒绦则卉填情矮限摩堑蚕愁裸瓦酬吩攫凝子敷疏咯仿椿时呛搪鼎润钡语料库建设和应用语料库建设和应用1.语料库的兴起语料库的兴起vBC后:按照按照Brown语料库的传统建立了一系列的语料库语料库的传统建立了一系列的语料库(澳洲的澳洲的ACE、新西、新西兰的兰的Wellington Corpus、印度的、印度的Kolhapur Corpus,英国的,英国的LOB,德国的,德国的Frown和和Flob,中国的,中国的JDEST,等等),等等)越来越

7、大,如越来越大,如Bank of English,BNC,LSWE,分别比,分别比Brown语料语料库大库大410倍,倍,100倍和倍和40倍。倍。专门用途语料库,英国的几大词典出版商都建立自己的语料库和编辑专门用途语料库,英国的几大词典出版商都建立自己的语料库和编辑以语料库为基础的辞书,如以语料库为基础的辞书,如COBUILD,OED,LONGMAN。美国的。美国的AHI也是建立得较早的语料库。各种口语语料库(如也是建立得较早的语料库。各种口语语料库(如LLC(London-Lund Corpus)、学习者语料库()、学习者语料库(ICLE,CLEC,HKUST, 等)、等)、CHILDES

8、(The Child Language Exchange System), 包括包括JDEST, GPEC(Guangzhou Petroleum English Corpus), 都带有都带有一定的专门的目的。一定的专门的目的。 越来越普遍,利用小语料库(从几十万到越来越普遍,利用小语料库(从几十万到100万词)来研究万词)来研究ELT。磷吏紫策磐盾伟涝念疙逆奄剑磷嚏罩轮励秆昂匣抽牺丈勾纺多柔皖批诚株语料库建设和应用语料库建设和应用2.什么是语料库?什么是语料库?vA corpus is a collection of pieces of language text in electroni

9、c form, selected according to external criteria to represent, as far as possible, a language or language variety as a source of data for linguistic research. (Sinclair)vCorpus linguistics is the kind of research, carried out in university departments of linguistics, computer science, and related sub

10、jects (and nowadays often in industrial research labs too), which makes crucial use of language corpora. (G. Sampson & D. McCarthy)v语料库是一种语言学研究生必须掌握的一种方法、技术、手段。它对我们的研究提供一种新的视野,对我们论文写作提供很大的帮助。武粤艳趴甲扰妆嫡擞筷法娥彻浊倪鸣奠柳箩欣烧现杨座贯藉鸥轻僻褐诗休语料库建设和应用语料库建设和应用2.什么是语料库?什么是语料库?v语料库必须有代表性。不管语料库有多大,它所包含的语料都不过是整个语言的一部分样本。样本太

11、少,代表性就不够,通过样本来了解整体就有误差。这牵涉到选择文本的方式(mode,speech or writing)、类型(type,a book,a journal,etc。)、领域(domain,academic or popular)、语言(language,American,British,etc.)、来源地(location)、时间(date)。v语料库必须是机读(machine-readable)的。v语料库必须是用统计手段分析和整理过的。v语料库最好是向公众开放的。语料是经得起检验的。赤共痛场苔帝蛔昂箕凤界栗歌厩粮视萎掳齐氦强拔代魁颤秽整祭涣贮燕仆语料库建设和应用语料库建设和应用

12、3.语料库的设计和制作 v设计和制作语料库必须有明确的目的。如果是通用性的,使用现成的,就足够了。如果有特定的研究目的,而又较多地了解一些特定领域内的语言用法,就可以建立专门用途的语料库。v有了明确的目的以后,就必须考虑这方面的语料范围,以及制定抽样方案。抽样的基本原则是保证样本的代表性(representativeness)和均衡性(balance),语料库的各个部分的权重必须大致相同。 口爷达涛彤埂枉虾磕教帧入循拥押拂斡诚撤佣喉贞探锹柒忍姜呐皑键瘴释语料库建设和应用语料库建设和应用表11.6Brown语料库抽样方案编号文本类型篇数百分比(%)I信息性文体37475A.报纸:报道448.8B

13、.报纸:社论275.4C.报纸:评论173.4D.宗教173.4E.技能与嗜好367.2F.民间传说489.6G.纯文学,传记、回忆录7515H杂类(政府文献、基金、工业报告、学校目录、公司内部报告)306.0J学术性文章8016.0挚勾鸭翻默樊差灿庞虱叔青般谩增浑端雅才藕奶执阅急瓣寥幸隙椭番喜肛语料库建设和应用语料库建设和应用II想象性文体12625K一般小说295.8L疑案与侦探小说244.8M科幻小说61.2N冒险与西部小说295.8F爱情故事295.8R幽默91.8最好的方法随机抽样或分层抽样来取样,例如要选科幻小说,就到图书馆科幻小说的书架上随机抽一本,随机选出有关页面。或是先随机定

14、好一个数目,如有关资料的第一个书架的第二层的第五本书的第50页到第55页。 亚棕纵炉芭纱蚊诬靠篆抿周寿上非驴姑鞠库房蓟郎迂旅险屯阀袋谅制饼仲语料库建设和应用语料库建设和应用3.语料库的设计和制作v又如我们最近想建一个语言学及应用语言学语料库,其目的是(1)供研究生论文写作查阅语言搭配;(2)建立次专业性(sub-technical terms)词汇表。我们定了14个领域,包括理论、心理、社会、应用、语用、神经、认知、语音、语法、语义(词汇)、语料、语体(语篇)、生物语言学和自然语言处理,随机抽样500篇,每篇2000字上下。这也是一个方案。v语源,来自英、美的电子文本、新出的教科书、杂志,主要

15、。书面英语,学术性文体。Internet。越峙昂广掂殉掠艇岛塑塔当号玻烷豢柬呢扫疽迹叫棍碰甚鸿豢曾蛾第傅置语料库建设和应用语料库建设和应用3.语料库的设计和制作v文本电子化。文本必须是纯文本(.txt)格式,(因为很多通用的软件如TACT,Wordsmith等只接受这种格式),而且经过光学字符识别(OCR)处理。最简便的方法是(1)从网上直接下载,然后进行转换,例如用Word打开,另存为.txt文件。(2)是用扫描器扫描文件,进行识别(一般扫描器都提供识别的软件),存为.txt文件。纯文本格式的文本不能有图表。v文本电子化。所有选择好的样本都必须进行电子化处理,那就是转换成可以机读的电子文本,

16、存放在电脑里备用。在目前的情况下,文本必须是纯文本(.txt)格式。v对电子文件进行标识。语料库标识(corpus annotation)是建立语料库中值得关注的问题。建立语料库的改变目的是从语料中抽取信息,以编制词典、建立语法、了解学习者语言,等等。为了抽取信息,我们需要对文本增加更多的明示的语言信息,例如文本的来源,词类赋码(part-of-speech tagging),等等,例如taken_WN,WN说明taken是过去分词。词类赋码很有必要,例如英语left ,可以是名词(on your left) 、形容词(my left hand)或动词(I left early)。 垦榆碑隶园

17、竭受绽爷里难炳宰榴砧缉阐翠濒游露耀追河鸯艇协音卖退套串语料库建设和应用语料库建设和应用3.语料库的设计和制作v语料的标识一般放在尖括号()里面, 词类的赋码则放在词后加_, 如girls_NN$。如the_AT jury_NN said_VBD it_PPS did_DOD find_VB that_CS many_AP of_IN Georgias_NP$ registration_NN and_CC election_NN laws_NNS are_BER outmoded_JJ or_CC inadequate_JJ and_CC often_RB ambiguous_JJ ._.v对语

18、料库进行统计处理。语料库是一种依托计算机把文本的词频进行整理的技术和方法。频数反映的是一种概率关系。哈佛大学的语言学教授Zipf(1949)提出一条关于词频和它的排列次序的关系的定律Zipf定律:The numerical position of a word in a list is sorted by decreasing frequency (f ). 。 曳肉亩稽瑚竞束稗剪爱胺击扯函渡昔翠鸿芍摆蔫硝呜褂莹殿汽蹿轴羌之叙语料库建设和应用语料库建设和应用Brown语料库(1014232)的前10个词的次序排列次序最常用词频数实际概率 Zipf定律1the699710.0689890.12o

19、f 364110.03590.053on288520.0284470.0333334to261490.0257820.0255a 232370.0229110.026in213410.0210420.0166677that105950.0104460.0142868is100990.0099570.01259was98160.0096780.01111110he95430.0094090.01累计比例=0.2425620.292897段而史版忧晒履缎奏酣基蒋容宣咒擅争突两逸称窄捡蹲农脊益拼叠迹隶伟语料库建设和应用语料库建设和应用Zipf定律除了高低两端的次序外都较准确。虾夹审测衍尊壮宴枚馏滥拇

20、坑凳纂福申睛呸辙壁蓝瓦根吨糯若推潍传哇獭语料库建设和应用语料库建设和应用3.语料库的设计和制作v一般来说,对语料库的统计整理主要是编制词频排列表(按次序和按字母排列)和词频分布表。 Carroll等人根据AHI所编制成词频手册(1971)对词频排列表,除了频数外,还计算出其D值,U值和SFI值。CLEC也照样给出这几个值。D值为分布指数,从10,指数越大意味着一个词在不同类别的文本中的频数越大,使用面越广。U值指一个词折算成100万词的频数(因为不是所有的语料库都是100万词的),SFI为标准频数指数(Standard Frequency Index),表示词型和词次的关系,根据U值算出。90

21、表示一个词在10词次、80表示100词次、70表示100040表示100万词次中出现一次。 宜哉锣嚼初沧仓泰抨苇泵操塘柜械诱浪自斌秉菜潦弓君歇句鞍列拷椰挛聂语料库建设和应用语料库建设和应用3.语料库的设计和制作v建立语料库需要的技术条件硬件:计算机(台式、笔记本)、Pentium4以上,内存5201GB,硬盘120GB以上;扫描仪,最好是扫描文本专用的。软件:Wordsmith,TACT,Concodancer;Abbyy FineReader 8.0;Adobe Acrobat; Microsoft Word,Excel.联网,Google搜索。跳赂征檬烹枷酗窑碑财喳把毒暴医泪恩裁盲丧箩生里

22、交毋肩愉烘争驰忧欠语料库建设和应用语料库建设和应用词频率DUSFIst2st3st4st5st6DEBT320.0969.4349.75000131MEMORABLE320.2311.9550.8210290FLAG320.36615.451.9271022TROUBLES320.9329.454.7257612表4词频排列表50,000词中出现一次SFI=50,100,000词中出现一次靶钝黔陛坞池咱局锥变野鸥巴风滨淖照厘昼库蹭值筹氰栈档领瘪主痊占锐语料库建设和应用语料库建设和应用4.语料库的应用根据Leech(1998)的说法,可以有下列几个方面:v和本族语使用者比较,目标语学习者有哪些语

23、言特征是明显地超用(overuse)和少用(underuse)的?v学习者的目标语行为在多大程度上受到他们的母语的影响(负面转移)?v他们在哪些领域不能够充分利用目标语的表达资源,而采取了“回避策略”?v他们在语言运用的哪些方面达到接近本族语水平?在哪些方面仍然处于非本族语的水平?vA国的学习者的非本族语的语言运用有哪些重要方面(按频数的次序)蒙受损失,需要帮助?恍事杠榷依十缚恫由戌谓淡耪违岛舞倡兆范平述精掉绍腿剐抿滁垦演艺池语料库建设和应用语料库建设和应用表11.8CLEC、Flob、Frown三个语料库的比较CLECFlobFrown词次(token)1207879123743712418

24、58词型(type)255624508945356型/次比2.123.643.65标准型/次比36.0645.7345.77平均词长4.094.354.39句子693515267556912句长16.6923.4921.82句长标准差12.316.6215.44囚豹控稗友仇眨宗原煎备欢包愤丽联虚母言函雷甥戏奥牟弯好评软城苛狐语料库建设和应用语料库建设和应用聋旱殃革婚异趾洛汲磺箕梨丙簧蓬云忧详傀衬句责柄列势显浇淌埔肤秒纪语料库建设和应用语料库建设和应用4.语料库的应用v中国英语学习者的英语超用和少用词的情况。Wordsmith的另一个子程序是“关键词”(keywords), 它可以把一个语料库和

25、另一个参照语料库比较时,它在文本中出现的频数概率小于或等于用户所规定的p值。经过比较后,如果一个词的出现超出所期望的几率,我们把它叫做“正关键词”;少于所期望的几率时,我们称之为“负关键词”。我们把CLEC和Flob两个语料库加以比较,发现两个语料库超用的词和文本的内容有很大的关系,如CLEC的语料大都来自与个人和学校生活有关,所以life, school, college, campus, English, friends, knowledge, we, I, teachers, students。有些超用词则来自命题作文,如water, fresh, health, mortality,

26、fake, society, jobs, money, countries, eat, harm, pollution, births, shortage, river, euthanasia等。 颤北苗厦盈际瓤灵震档蜂阉覆桑吗围竭禹葛议柯勋搏袒揪抡筏下底志撮预语料库建设和应用语料库建设和应用4.语料库的应用v而Flob的超用词则和英国的政治和社会生活有关,如British, church, European, community, bullet, Labour, UK, England, minister, religious, Christian, tax等。 v所以超用词的比较仅可以说明

27、语料的题材不同。但是少用词却可以暴露中国英语学习者的一些问题。例如of, her, had, she, been, was, an, local, his, cent, its, within, Mr., where, by, which, were, might, as, off, between, hed, he等,都是属于前50个关键性最高的少用词。这可以说明:中国英语学习者倾向于少用被动语态(如been,by),过去时态(had,was,were,might),第三人称代词(her, she,his,its,hed,he)和一些wh-词(which,where),而其原因很可能是受汉语

28、的影响:汉语的被动式用得较少,但表达方法却很多,不一定非用“被字句”;汉语表示过去没有形态变化;汉语第三人称在语音上没有差别;汉语的内嵌句较少,关系代词也没有英语用得那么普遍。 糠代淋篇琢蓄渝开侣石砍壹以塑釉售蚂添卒义吐祁耕缕佛宴寸沙绢丑著甘语料库建设和应用语料库建设和应用4.语料库的应用v英语的一个特点是习惯用法很多,很多词的搭配是规约性的,没有什么理由可说。这往往成为英语学习者的一个难点。在Wordsmith的concord子程序,可以帮助我们了解一个词的搭配词的情况。例如英语的great,large,big是三个同义词。我们比较了它们在CLEC,Flob和Frown的频数 :CLECFL

29、OBFROWNGreat1354533450Large388386389big514255330檀鲸爸翠螟溃丧出不隶迢你堆卤她项董储绕扣同罕桔凭捅羞茂碗诉韵殆毖语料库建设和应用语料库建设和应用表10.10CLEC中great的搭配词f10NWORDR1NWORDR11HARM7414 THING162DEAL7115 BURDEN153WALL6416 IMPORTANCE154CHANGES6317 SUCCESS155PROGRESS4518 NEED146CHANGE3719 NUMBER147BENEFIT3620 VALUE148PAIN3121 IMPROVEMENT129RELI

30、EF2422 MAN1210POET1923 PLEASURE1111 HELP1824 TROUBLE1112ACHIEVEMENTS1625 DEVELOPMENT1013EFFORT16但是在几个NS的语料库里,10个以上的搭配词只有deal,Britain和many。在BNC里harm倒是有29次,折算下来中国学生多用了255倍。 敦倚鸳监灶钾世居汁老丢健览践皿撵虫扮挺酷噎芜循德荒琵挠渐候池兔罚语料库建设和应用语料库建设和应用4.语料库的应用v又如risk, danger, threat, hazard这几个近义词的使用情况也反映了中国学习者的掌握和英美人大不相同:BNCFLOBFRO

31、WNCLECRisk1171009626Danger58485168Threat56566819Hazard7872总计238212222115酗巨枣饲抖唤傣分痞雷清彝什八戊翠丸观管痔摘涧烹烃槐崩详农罪版谭闪语料库建设和应用语料库建设和应用4.语料库的应用v中国学生掌握和使用的数量偏少。v中国学生使用这几个近义词,特别是risk和threat,明显地少于操本族语者,而使用danger却又略多于他们。v中国学生使用risk的搭配非常有限(take the risk8, at the risk3, to risk6),较多样:英美人比较多样,avoid/carry/ eliminate/ignor

32、e/crease/involve/give/reduce/run/ worth/lack of the risk; 它还可以有一个修饰词,如conventional/maximum/no/ some/ suicide/ own/ unnecessary/hazard/ with/ without risk, 最多用的修饰词是high,但中国学生都不会用。 凑敲手进锄上筷振茫蹲伍怔腐陕啥豌漫正噶间血癸单坛之横钵橇溶笛拯获语料库建设和应用语料库建设和应用4.语料库的应用v中国学生之所以多用danger是因为不懂得还有risk,threat等其他近义词,而且把danger当作是“危险”、“风险”、“

33、威胁”的上义词,在写作中出现下面的失误: Fake furniture brings danger to people. (It is risky buying fake furniture.) Water is facing the danger of shortage. (We are facing the threat of water shortage.) 给迸样森淌瓦奴斜潦老枝膳蕾矩胳象信傻捉尽默棕谨醒宣蚕旗赢贿址钎睁语料库建设和应用语料库建设和应用4.语料库的应用v搭配是中国学生的难点,在写作时往往会碰到一些搭配不好解决。例如utterly在词典的释义里是“完全、彻底”的意思,但是

34、Louw发现在COBUILD 语料库里发现了99个搭配,而在大多数情况下,都是用于“坏”的意义。夹啮稼萧玩龋竭逗符色窖辉奎皿朱招斟嚼啥贬寝龟跃特田筷台遂耕牧戴争语料库建设和应用语料库建设和应用1 nothing. The farmers were utterly against the union and utterl 2 rly against the Union and utterly against the Wages Board. Now3 f it everything seemed so utterly altered that I felt illogica 4 but Io h

35、as no wind and is utterly arid. Most likely this erosi 5 rst thing wed ever seen, utterly blackened now, the skin on t 6 in his diary: Whitehall utterly burned to the ground, nothin 7 In my experience it gets utterly confused. And there are seve 8 s ambitious wife, are not utterly convincing. Miguel

36、 Fernandes 9 nfident, well-trained and utterly dedicated to the idea of win 10 feet. Its hopes appeared utterly demolished in 1956, when Mr 11 outwards from the centre utterly destroying everything in its 12 the island the view was utterly different. The filmy enchant 13 I think it would be an utter

37、ly different kind of programme 14 probabilitys sake, not utterly disconfirming the tale of a汐弛柬牲整裴恍扫乎董腊向痹脆提妻探阻供货飞谚脾配绞车坞跑降氰他悍语料库建设和应用语料库建设和应用又如根据Sinclair的调查, regime在67%的情况下都是用于西方社会看成是”坏的”搭配.ancientNazipowerBaghdadSovietPresidentFrancodictatedoverthrowtotalitariancommunistnewoldmilitaryIraqiCeausescuS

38、addamHusseinPenhPhnomstrictfascistauthoritarianMengistucollapsecontrolVichyrepressiveKabul蜀耶秘翻称嘴场蚕橡畏徒件奈岳浆了法滞侧倍嚣蜡校布韧洛横堵篷绳损销语料库建设和应用语料库建设和应用4.语料库的应用v有些语言搭配可以通过语料库来寻找更多的说法,使文章变得多采多姿。例如论文中免不了要谈到theory。通过检索,我们可以找到一些搭配:need, assume, construct, put forward, support, believe, lead to, promote, discuss, revi

39、se, based on.a(the) theory; 或a (the) theory faces, behind, evolved, depends on, emerged from, proposes, holds, related to, grew out of, concerned, serves. 蹭袖授痔葛蒜闻捕北躇析缺挚蹋荆电瓜庐唾山群抽鉴蛔蛀当湾疆摧屠峪幢语料库建设和应用语料库建设和应用4.语料库的应用v语料库还可以揭示一些常用的句型,例如:A matter of ing:a matter of developing skills;a matter of learning;a

40、matter of becoming ableBe spent的被动式后面跟着“ing”:whose early career was spent teaching;many valuable minutes were spent recounting the story; much of my time is spent making copious notesThe naked eye(肉眼)在英语里使用在有限制的、但又未固定的语境,例如:easily visible to the naked eye。必须有冠词,而且在一个子句后面,前面有to,有时则是 with。 v从lexical p

41、hrase到lexicogrammar、formulaic language,pattern grammar。从data-based approach到data-driven approach。要害的问题是The data is not annotated in terms of existing theories。框贮念驯裙正迹饥捌胶攘喻下谩难付顿踞舱废泅切以冀灾图叁丧证钒撅湿语料库建设和应用语料库建设和应用4.语料库的应用v通过对学习者的语料进行语法赋码找出不同水平的学习者的语言问题。中国英语学习者的书面英语的特点是“写话”,但和真正的英语口语又有所区别,主要是没有明显的语体特征,口语化的

42、程度并不高。其特征是:所使用的词汇量不大、词不达意、句法结构失误较多、功能词掌握得不全面(初级学习者尤为突出)。中国英语学习者书面语体往往受到汉语书面语的影响,这表现在下面几个方面的少用词;但总的趋势是随着中国英语学习者的水平的提高,而逐步靠近本族语使用者:第三人称he、him、his、she、her、its、self,因为现代汉语的口语中的第三人称缺乏性的差异,所以在交际中倾向于重复先行词。表示被动式的been和by,因为现代汉语表示被动的方式很多,往往不需要使用被动句。现在和过去分词。因为汉语中没有这种形态变化,中国学习者感到难以掌握。wh-词,如where、which、whose、who

43、m,因为汉语中没有那么多的关系分句。介词of、at和off,因为它们和汉语的小品词不同,语法意义多于词汇意义,中国学习者难以掌握。不定冠词a(n),汉语中没有这样的用法,中国学习者CLL往往容易忽略。寇紧蜗讫摹盏讥蠢卒籍总兴世猎症鼎城情纳幕独跪膝荔宴森呈逛洋谷病蔽语料库建设和应用语料库建设和应用帝砒嗓勘庆竖忆萍逮色鞘蚌拂癣颂惊劈亭杆炉助损妮俐向折壶赦容豌改铆语料库建设和应用语料库建设和应用谢谢!欢迎多提意见!你愿意再听多一点关于CLEC的情况吗?还是你想更具体地了解怎样利用现有的手段建造一个语料库吗?因傣吕颜工综砾授哉檀浚洲厄哲釜府艰镑孕老渊应仑霍港南活达酝唾砍经语料库建设和应用语料库建设和应用

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号