北语动态作文语料库符号说明

上传人:平*** 文档编号:4080788 上传时间:2017-08-15 格式:DOC 页数:7 大小:166KB
返回 下载 相关 举报
北语动态作文语料库符号说明_第1页
第1页 / 共7页
北语动态作文语料库符号说明_第2页
第2页 / 共7页
北语动态作文语料库符号说明_第3页
第3页 / 共7页
北语动态作文语料库符号说明_第4页
第4页 / 共7页
北语动态作文语料库符号说明_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《北语动态作文语料库符号说明》由会员分享,可在线阅读,更多相关《北语动态作文语料库符号说明(7页珍藏版)》请在金锄头文库上搜索。

1、“HSK 动态作文语料库”语料标注及代码说明 “HSK 动态作文语料库”从字、词、句、篇、标点符号等角度,对所收入的作文语料中存在的外国人使用汉语的中介语偏误进行全面标注。 1 、字处理(包括标点符号) C:错字标记 ,用于标示考生写的不成字的字。用C 代表错字,在C前填写正确的字。 例如:地球C(“ 球”是错字) 、这C。 :别字标记,用于标示把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至中 B 的后面,并在前填写正确的字。 例如:提B 题高、考虑B 虎 。 L:漏字标记,用于标示作文中应有而没有的字。用L表示漏掉的字,并在L前填写所漏掉的

2、字。 例如: 后悔L,表示“悔”在原文中是漏掉的字。 农L药,表示“农”在原文中是漏掉的字。 D:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至D中 D的后面。 例如:我的D 的,表示括号中的“的”是多余的字(原文中写了两个“的”) 。 F:繁体字标记,用于标示繁体字。把繁体字移至F中 F 的后面,并在F 前填写简体字。 例如:记忆F 憶、单F 單纯、养F 養分F 份。 注意: 1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记。 例如:俭朴F 樸B 僕。 2)繁体字写错了,标为:后F 後C。 Y:异体字标记,用于标示异体字。把异体字移

3、至Y中 Y 的后面,并在Y前填写简体字。 例如:偏Y 徧、沉Y 沈。 P:拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至 P中 P 的后面,并在P前填写简体字。 例如:缘Pyan分、保护 Ph。 #:无法识别的字的标记, 用于标示无法识别的字。每个不可识别的字用一个#表示。 例如:更#保存自己的生命, BC:错误标点标记,用于标示使用错误的标点符号。把错误标点移至BC中 BC的后面,并在BC前填写正确的标点符号。例如:勤奋、BC ,刻苦的精神。 BQ:空缺标点标记 ,用于标示应用标点符号而未用的情况。把BQ插入空缺标点之处,并在BQ中 BQ 的后面填写所缺的标点符号。 例如:周围的

4、环境很安静BQ,生活也非常平凡。 BD:多余标点标记,用于标示不应用标点符号而用了的情况。把多余的标点移至BD中 BD 的后面。 例如:我家周围的BD, 美丽风景。 2、词处理:(包括成语) CC:错词标记,用于标示错误的词和成语。包括 4 种情况: 1)把词的构成成分写错顺序的。 把写错的词移至CC中 CC 的后面,并在CC前填写正确的词。 例如:首先CC 先首、众所周知CC 众所知周 。 2)该用甲词而用乙词的。这种情况类似别字,但属于用词层面上的错误。 标示方法同上。 例如: 虽然现在还没有实现CC 实践, 它在CC 对价格方面有点贵,所以没得到广大消费者的支持CC 持支。 3)生造词。

5、指考生自造的、或某些外语中可能有而汉语中不存在的词。 例如: 农作物CC 农产物/农物 、农产品CC 农作品 但长期来看造成环境污染,破坏自然生态CC 目态 , 绿色食品的好处在于吃这些食品后在身体里没有农药的残留量CC 潜留量 。 4)词语搭配错误。包括词性、音节等方面的搭配错误。 例如: 最好的办法是两个都保持CC 走去平衡。 我也回CC1 回去沈阳。 吃这种东西会CC1 可以得CC1 得到 病CC1 疾病。 CLH:离合词错误标记,用于标示各种和离合词相关的错误。标在有错误的离合词的后边,表示前边的离合词用法有误。 例如: 我快要毕业CLH大学CQ 了。 虽然这么L多年都没见面 CLH过

6、, 我对哈尔滨CJ-zy 很 感兴趣。有观光CLH 哈尔滨的宿愿。 W:外文词标记,用于标示以外文词代替汉语词的情况。把外文词移至W 中W 的后面,并在W前填写相应的汉语词。在 W 和外文词之间填写汉语词的字数。 例如: 非洲W2Africa、爵士乐W3jazz。 教我工作的方法W2ABC。 CQ:缺词标记,用于标示作文中应有而没有的词。在缺词之处加此标记,并在CQ中 CQ 的后面填写所缺的词。 例如: 这就CQ 要 由有关部门和政策管理制度来控制。 有的农民CQ 在 不使用化肥和农药的情 B 精况下BD,养农作物, CD:多词标记,用于标示作文中不应有而有的词。把多余的词移至CD中 CD的后

7、面。 例如: 然后肯德基的收入有所增加CD 了。 中国政府应该采取良好的措施来管理农业CD 方面, 但我觉得CD 按照上面所写的方法是现在很多人或国家用的方法。 词处理中需要注意下列问题: 1)因介词、方位词等的缺少或多余造成的结构不完整,助词的错用、多用、漏用,词性误用等,均视为词的错误。 例如: 随着社会CQ 的 发展,人们CQ 对吃的东西很重视。 在这个过程CQ 中 特别是非洲CD 的话,问题很大的。 2)结构助词“的” 、 “地” 、 “得”混用:按错词处理。 例如: 按照人们的要求不用化肥和农药的话,产量会大大地CC 的 下降。 我认为当你很饿的时候,什么东西都吃得CC 的下。 孩子

8、们饿得CC 地大哭小叫, 3)该用汉语数字而用阿拉伯数字的,一律按错词处理。 例如: 那应该怎样解决呢?所以我想出了一CC1个办法,少用化肥和农药。 把“十五”写成了“一五”,应把“一五” 整体按错词处理,而不能仅仅把“一”处理为别字。 4)错词、多词、成分赘余的一个标注符号中可以包括两个或两个以上的词。 例如: 我想任何人CC 每一个都不要有浪费食品的习惯, (每/一/个) 没有CC2 重视做未经污染的食品就是绿色食品。 (重视/做/未/ 经) 5)原文字数和改后字数不一致的,须在括号中 CC 之后且紧靠 CC 处加一个阿拉伯数字,表明改后的字数。 例如: 战Pzhan争中最困难的人是没有力

9、气的孩子和老人CC5 老弱子 。 所以我认为首先农民可以使用天然肥料CC4 化肥,代替化肥来种植农作物 6)不清楚或无法理解的词用CY标示,表示“存疑”,标在该词的后面。 例如: 虽然这么L多年都没见面 CLH过,但我和他们的忆惯CY,是忘不了的。 3、句处理: CJ:病句标记,用于标示错误的句子。一般标在有错误的句子之后、该句标点之前,并用小写汉语拼音字母简要标明病句的错误类型。 例如: 他把那本书看CJba。 我认为我们先尽量地B 的产出农作物给他们,先给他们不挨饿CJjy。 如果有人批评这是太奢侈CJxw, 句子错误类型代码: CJba : 把字句错误 CJbei : 被字句错误 CJb

10、i : 比字句错误 CJl : 连字句错误 CJy : 有字句错误 CJs : 是字句错误 CJsd : “是的”句错误 CJcx : 存现句错误 CJjy : 兼语句错误 CJld : 连动句错误 CJshb : 双宾语句错误 CJxw : 形容词谓语句错误 CJ- :句子成分残缺错误标记,用于标示由于成分残缺造成的病句。在短横后边标明所缺成分的名称,该名称用小写代码表示;在小写代码之后填写所缺的具体词语。标在成分残缺之处。 例如: 为了增加CC 满足粮食,CJ-zhuy 人们使用了化肥和农药,这样产量就会大大提高。 这样的活动CJ-sy 开展以来,肯德基的垃B 拉 圾C总量大大降低。 那两

11、种CC 个东西就容易伤害人类的CJ-dy 健康 系统。 从具体CJ-zxy 情况来看, CJ+ :句子成分多余错误标记,用于标示由于成分多余(赘余)造成的病句。后边用小写代码标明多余成分的名称,并把所多余的具体词语移至该名称的后面。标在成分多余之处。 例如: 这是我们CJ+dy 做人的责任。 而且研究CJ+buy 下去产量能提高的办法。 而且CJ+zy 正在还死去好多人。 句子成分采用层次分析法的观点,共 8 种: CJ-/+zhuy :主语残缺或多余 CJ-/+wy :谓语残缺或多余 CJ-/+sy :述语残缺或多余 CJ-/+by :宾语残缺或多余 CJ-/+buy :补语残缺或多余 CJ

12、-/+dy :定语残缺或多余 CJ-/+zy :状语残缺或多余 CJ-/+zxy :中心语残缺或多余 CJX :语序错误标记,用于标示由于语序错误造成的病句。标在语序错误的词语的后边。如果是相邻的两个成分语序错误,按照自然顺序,把CJX标在前一个成分的后边。 例如: 大多数CJX这些人生活CC2 活 在很不好的地方, 可是这两个问题同时CJX要解决非常不容易, 现在每个人很重视健康,受欢迎CJX绿色食品。 CJZR :句式杂糅错误标记,用于标示把两种不同句式、两种不同说法混在一起的病句。标在句子末尾,标点之前。 例如: 这个问题不可能一两年解决的问题CJZR。 现在,全世界流行是绿色食品CJZ

13、R。 每次吃对身体有害于健康的东西CJZR。 因为,人们的必生存之一中最重要的是饮食CJZR, CJcd :重叠错误标记,用于标示句中词语的重叠错误,包括重叠方式上的错误,也包括不该用而用重叠,或该用而不用重叠的情况。标在出现重叠错误的词语之后。 例如: 而对生产者来说,尽量不用化肥和农药,在出货之前,进C行洗洗CJcd。 还有我们CQ 应 对绿色食品研究研究CJcd 。 CJgd :固定格式错误标记,用于标示固定格式搭配上的错误。 例如: “一就”缺少“ 一” 或者“就”。 现代社会应当认“ 保护自己,尊重其他人” 为口号CJgd! WWJ :未完句标记,用于标示没写完的半截子的句子。标在未

14、完成句的末尾处。 例如: 只是全球WWJ 最后国家政府不考虑经济问题、积WWJ 不知道什么时候会普及起来,但是我认为这还是不是个WWJ CJ? :句处理存疑标志,用于标示错误类型不清楚的、或错误类型标注很不方便的、或句义不明且有语法错误的的病句。标在存疑病句之后、该句标点之前。 例如: 地球上,有的地方还在“ 饥饿” 来艰苦CJ ? 。 还要想每个人的健康是帮助饥饿人的办法越来多健康的人会越来多帮饥饿的人CJ? 。 把化肥可以取代CC 代取用草、剩饭做的自然肥料 CJ?,把农药也可以取代CC 代取喜欢吃害虫的动物CJ?。 4、篇章处理:(包括复句) CP :篇章错误标记,用于标示篇章错误。大括

15、号的前半和后半分别表示有错误的篇章的起点和终点,在起点处标 CP,在终点处标 P。即:CP,。,。P 所谓篇章错误,主要指句子和句子之间在衔接方面的错误。最典型的情况是每个单句都正确,但作为一个整体来看则句子相互之间缺乏联系,不能构成一个紧凑、自然、流畅的成段表达。而产生这种情况的原因,可能是语义方面的,也可能是连接方式方面的。 例如: CP 我们经过了漫长的历史,一些没有用的人死于历史中,挨饿其实是可以克服的。P (前后句意义上无关) CP 吸烟对孩子们CJ-sy 有不好的影响,这一观念他会不会知道呢?所以我早就不理他了。P (用了表示因果关系的连词,但句子之间并不存在因果关系) CP 目前,随着人们生活水平CQ 的提高,CJ-zhuy 人们CD 就对饮食

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号