杨百翰大学BNC语料库使用说明-中文版

上传人:我*** 文档编号:137472615 上传时间:2020-07-08 格式:PPT 页数:43 大小:1.06MB
返回 下载 相关 举报
杨百翰大学BNC语料库使用说明-中文版_第1页
第1页 / 共43页
杨百翰大学BNC语料库使用说明-中文版_第2页
第2页 / 共43页
杨百翰大学BNC语料库使用说明-中文版_第3页
第3页 / 共43页
杨百翰大学BNC语料库使用说明-中文版_第4页
第4页 / 共43页
杨百翰大学BNC语料库使用说明-中文版_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《杨百翰大学BNC语料库使用说明-中文版》由会员分享,可在线阅读,更多相关《杨百翰大学BNC语料库使用说明-中文版(43页珍藏版)》请在金锄头文库上搜索。

1、杨百翰大学BNC语料库使用说明,杨百翰大学BNC语料库简介,1. 简介 1.1 通过这个网址,可以搜索到100 million词的British National Corpus (1970s-1993). (当然现在Corpus of Contemporary American English(1990-2009)能在线免费提供 400+ million 词,在线网址为:http:/www.americancorpus.org/),http:/corpus.byu.edu/,选择学习BYU-BNC的原因,1. BYU-BNCm免费且在线方便 2. BYU 还有另外两个语料库TIME Corpu

2、s of American English 和Corpus of Contemporary American English (COCA) ,它们的使用方法基本相同,1.2 BYUBNC界面简介,2. 主要搜索功能 2.1 搜索words、phrases、lemmas、wildcards和其他更加复杂的字词 2.1.1 输入单词“mysterious” (图2.1.1-1): 得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率 若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例):,图2.1.1-1,图2.1.1-1,使

3、用CHART显示,图2.1.1-3,使用KWIC显示方式,2.1.2 输入词组“white+名词” (图2.1.2-1) 得到的结果都是white后面跟的名词短语 (图2.1.2-2),检索表达式为:white n*,图2.1.2-1,规则:输入名词的话用正则表达式: n*;动词: v*; 形容词: aj*; 副词: av*,图2.1.2-2,White+名词的短语,2.1.3 输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2,图2.1.3-1,图2.1.3-2,2.1.4 输入lemma(即一个单词的单复数、时态等所有形式),若要得到

4、sing这个单词的所有形式,可以如下图所示(图2.1.4-1),图2.1.4-1,规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。,图2.1.4-2,形容词early的圆形,比较级和最高级三种形式一次性检索出来检索,2.1.5 输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2): 规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.aj*;若要得到动

5、词+任何词+ground的所有词组,那么输入: vv*ground即可。前者用来研究词汇,后者用来查询特定词性的搭配。,图2.1.5-1,图2.1.5-2,动词+任何词+ground的所有词组,2.2 搜索搭配词和出现的频率 如 “thick后跟的名词” (图2.2-1),图2.2-1,规则:在context里输入n* 后选择4,表示在thic4后面(4跨距范围内)出现的任何名词,如跟在 “smile前面的形容词” (图2.2-2),规则:在words里输入: smile.n*,表示作为名词的smile; 在context里输入: aj*表示其前后出现形容词的语境。,Confidence前使用

6、的行用词 图2.2-3,2.3 搜索在子语料库(register)内(或之间)出现的频率(或比较)(不同语域中的用法) 如在Fiction和Newspaper子数据库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2),图2.3-1,图2.3-2,但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别选择section 1&2,如下图(图2.3-3):,图2.3-3,2.4 进行语义倾向比较 2.4.1 比较近义词 如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1):,图2.4.1,规则:在words的方格里分别输入hot和warm,再

7、在context方框里输入nn*,表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。,2.4.2 比较反义词 如:woman和man前面所跟的形容词的区别(如图2.4.2),图2.4.2,规则:在words的方格里分别输入woman和man,再在context方框里输入aj*,选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。,2.4.3 搜索近义词 如:搜索beautiful的所有近义词(如图2.4.3-1),规则:在words的方格里输入=beautiful,表示和beautiful语义相近的所有形容词。,再如:搜索动词clean的所

8、有近义词,如下图:,图2.4.3-2,当然可以进一步搜索与clean语义相近的动词+the+名词的词组,=clean.v* the n* 如下图:,图2.4.3-3,BYU-BNC词性附码的使用,1)查询多义词特定的词性,如for 2)某个词前/或者后面特定词性的若干搭配词, 如confidence 前的形容词 3)词性附码放置的位置 Words或者context处,将BNC KWIC制作成mini text,需要工具: 1. 文本编辑器 2. MS-word,以上方法同样可以用于检索代表当代美国的语料库 http:/www.americancorpus.org/,以及以不同年代的TIME做成的历史语料库http:/www.americancorpus.org/,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号