_组块_与语言结构难度

上传人:wt****50 文档编号:43546625 上传时间:2018-06-06 格式:PDF 页数:14 大小:499.71KB
返回 下载 相关 举报
_组块_与语言结构难度_第1页
第1页 / 共14页
_组块_与语言结构难度_第2页
第2页 / 共14页
_组块_与语言结构难度_第3页
第3页 / 共14页
_组块_与语言结构难度_第4页
第4页 / 共14页
_组块_与语言结构难度_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《_组块_与语言结构难度》由会员分享,可在线阅读,更多相关《_组块_与语言结构难度(14页珍藏版)》请在金锄头文库上搜索。

1、“ 组块 ” 与语言结构难度3陆丙甫 蔡振光南昌大学人文学院 爱丁堡大学心理学系提要 本文根据短时记忆的限度为“ 七左右 ”(72)以及短时记忆对“ 四 ” 的敏感这两个心理学基本现象,对一些语言结构现象进行量化的分析和解释。 “ 七左右 ” 代表了处理语言时大脑中能够容纳的离散块数量的最大限度,“ 四 ” 代表了一个敏感点。初步分析表明,一个句子的处理过程中如果平均每时每刻要记住4个以上的离散板块,句子就会显得累赘。并且,处理者会把需要记住的离散块数量尽量控制在“ 四 ” 以下,需要记住的离散块如果没有超过四,处理者会倾向采取延迟组块的策略,以避免错误组块;离散块如果超过四,处理者会倾向采取

2、超前组块的策略,以及时减轻大脑负担。组块计算为语言单位结构难度的计量提供了一个普遍适用的基本起点。关键词 短时记忆 组块 结构难度 消极修辞一 短时记忆对语言结构的限制短时记忆和注意力的限度是一个重要的心理学常数。根据“ 主干成分分析法 ”(陆丙甫, 1981)或“ 直系成分分析法 ”(陆丙甫, 2008) ,任何语言结构都能切分成不超过“ 七左右 ”的主干成分或直系成分(核心及其从属语)。据董振东(1980)介绍,他在研发英中机译系统(即后来的译星)时,遇到一个问题,每个父节点下的子节点可以有多少。当时他随机地规定了不得超过6个,加上父节点自身共7个。董振东后来发现(个人交流) ,该系统在近

3、10年的考核中,测试了真实文本中的上万个句子,从来没有遇到子节点有溢出6个的,除非是分析出错了。关于语言结构的切分,是一种静态的分析。陆丙甫(1986)进一步指出,理解句子的“ 组块 ”(chunking)动态过程中,任何时刻脑子中所记住的离散块数量也不会超过七块左右。事实上,静态切分和动态组块虽然本质不同,但有密切联系。二者都受到短时记忆限度的制约,但是具体内容不同。在静态的分析过程中,分出来的都是句子的直系成分。在动态的组合过程中,进入计算的单位不必都是直系成分,而是广义的离散块。直系成分都是离散块,而离散块不一定是直系成分。因此,我们能从离散块不能超过七块左右,即所有组合的瞬间都不能超过

4、七块左右,推理出静态的结构成分也不能超过3陆丙甫 蔡振光:“ 组块 ” 与语言结构难度3本文提纲曾在上海高校比较语言学E 研究院召开的“ 语言研究视野的拓展国际研讨会 ”(上海师范大学, 2008年1月12 - 14日)上宣读,与会者提出不少有益的反馈意见,特此致谢。七块左右。换言之,可以从离散块不能超过七块左右,推导出直系成分也不能超过七块左 右,既然直系成分都是离散块。 静态切分出来的结构,也就是动态组块过程中即将结束的那一时刻的结构。因此,静态切分的限度其实可以由动态组合的限度推导出来。 也可以换一个角度说,静态的结构模式又是对动态过程提炼的结果,或者说,是短时记 忆限度对动态处理的限制

5、的语法化。动态组块过程要运用到静态的结构模式:只有那些符 合静态结构模式的离散块的排列才能组成一块。近年来心理学界提出“ 四左右 ”(41)也 是一个具有重要心理学意义的数字,它代表了人类信息处理时“ 关注 ”(focal attention)范围的限制(见Cowan, 2000的总结)。 本文在以往关于“ 七左右 ” 对人类语言结构影响的研究基础上,进行一些补充并具体分 析“ 四 ” 对人类语言结构和语言理解过程的影响。二 语言单位结构难度的具体计算2. 1同步组块和结构难度 我们不妨采用“ 瞬时块数 ” 和“ 平均块数 ” 两个指标去衡量句子结构体的“ 结构难度 ”, 即处理难度或感知难度

6、(陆丙甫, 1993: 190 - 193)。 “ 瞬时块数 ”( instant chunk number, I CN)指某一瞬间脑子中记住的离散句法单位(不包 括暂时没有赋予意义的音节)的块数。瞬时块数不会超过七块左右。 “ 平均块数 ”(meanchunk number, MCN)是平均每一时刻(每处理一个新单位时)脑子中记住的离散句法块数。 我们认为MCN是衡量句子结构难度的最基本标准。 下面(1a)是一个以语素为基本单位去计算瞬时块数和平均块数的例子。(1) a. 我 们 今 天 下 午 讨 论 语 法 问 题。I CN:112232334451MCN = (1 +1 +2 +2 +

7、3 +2 +3 +3 +4 +4 +5 +1) /12 =2. 58b. 我们 今天 下午 讨论 语法 问题。I CN:122341MCN = (1 +2 +2 +3 +4 +1) /6 =2. 17 事实上,上面(1a)所描述的那种组块过程还可以简化。我们并不是听完一个音节就处理 的,也不是听完一个语素就处理的,实际理解过程很可能是每听完一个“ 韵律词 ”(冯胜利,2001)或一个“ 音步 ” 才进行组块的。也就是说,听到“ 下 ” 的时候我们通常不会去考虑它的 意义,而只是把它当作一个暂时没有赋予意义的音节去记忆的(所谓“ 回声记忆 ”)。根据 “ 选择性干扰 ”( selective i

8、nterference)的道理,可以把对音节的处理跟句法成分的处理分开 来。所谓“ 选择性干扰 ”,就是说同时执行两项任务时,两项任务的性质越相似,互相干扰越 大。而执行不同的任务,则干扰比较小。如我们可以一边做作业一边听歌曲,但是同时听两个歌曲或做两门功课就很困难。同样,处理音节内部、 词内部的结构时,对处理句法结构干 扰不大。因此我们可以用“ 词 ” 为基本单位去计算脑子中记住的板块数目。 在句子理解领域,一般都认为我们大脑里有一个语音 词汇处理机制,还有一个句子处 理机制(Frazier et al . , 1993) ;当我们读到一个字(如“ 下 ”) ,我们一般把它放在语音 词汇4世

9、界汉语教学 第23卷2009年第1期处理器里面,然后继续读下面的字(如“ 午 ”) ,并在词汇处理器里把这两个字组成一个词,提 交到句子处理器里进行组块。当然,将一部分组块工作放到语音 词汇处理机制去处理,不 是说词汇处理对整个处理的负担没有影响。事实上,两个过程肯定是互动的,而表达这种互动关系的方法之一是数量转换,如计算出词汇处理难度对句子处理难度的影响大小。由于 我们暂时不知道短时记忆跟语音 词汇处理的关系,可以暂时把词汇处理过程忽略不计。 (1b)就是以“ 韵律词 ” 为基本单位的计量。这样,原来听到“ 下 ” 时的数字3就可以跳过不算了。如果以建立在“ 音步 ” 基础上的“ 韵律词 ”

10、 为基本句法组块单位,即使把“ 讨论 ” 改 为“ 讨论了 ” 或者“ 不讨论 ”,也不会影响句法组块:因为“ 讨论了 ” 或“ 不讨论 ” 仍然是一个音步。汉语音步有三种:单音节的“ 弱音步 ” 、 双音节的典型音步和三音节的“ 超音步 ” 。 “ 讨论 了 ” 和“ 不讨论 ” 都是超音步。 语法学界一般认为“ 白的狗 ” 是一个短语而“ 白狗 ” 是一个复合词。前者更强调了“ 白 ” 这个性质,具有新信息或对比信息的作用。可以设想,交际中处理由两个韵律词组成的短语 “ 白的狗 ” 比处理一个韵律词组成的复合词“ 白狗 ” 困难,需要投入的脑力资源比较多。而这可以从组块计算上明确显示。 “

11、 白狗 ” 可以整个作为一块处理,而“ 白的狗 ” 则是两块。我们 不说“ 白狗 ” 而选择说“ 白的狗 ” 时,通常是强调“ 白的 ” 这一性质,会把“ 白的 ” 念得比较重。 因此,“ 白的狗 ” 不宜处理成一个韵律词,应处理成由两个韵律词“ 白的 ” 和“ 狗 ” 组成的短 语。 又如,“ 喜欢不喜欢、 担心不担心 ” 等格式。由于汉语中2 +2形式的四音节结构的优势作用,往往会省略成“ 喜不喜欢、 担不担心 ” 。比起其他省略后可能的四音节形式,如“ 喜欢 不喜 ”“ 喜欢不欢 ” “ 欢不喜欢 ” 等,“ 喜不喜欢 ” 这种格式有两个好处。一是保持了“ 首、 尾 ” 不变而跟原来的五

12、音节完整形式保持了最大的一致,二是由于“ 喜不喜 ” 无法分析而可以放 到语音 词汇处理机制里去处理,从而减少语法处理机制的负担。也就是说,可以直接把整 个“ 喜不喜欢 ” 看作一个句法组块单位。 人脑语言处理机制显然分成不同的层次和部门,语言处理是个各部门机制协调合作的结果。这个过程中,各机制的分工必然有某种比较理想的均衡的比例。2. 2不同组块方式对结构难度的影响 下面例子说明对于同样的语段,不同切分和组块会影响到处理时感受的结构难度(以 下把语音上没有独立性的语缀“ 的 ”,不论是否附在一个词后还是附在一个短语后,都不看 作一个独立的板块,理由见后面第三节的分析)。(2) a.【 鲁镇的

13、 酒店 】 的 格局1 1 1MCN =3 /3 =1. 00b.鲁镇的 【 酒店的 格局 】1 2 1MCN =4/3 =1. 33 例(2)两个切分虽然有歧义,但两个歧义差别不大,不影响到表达的逻辑真值。像“ 爱 上了老板的秘书 ”,不同切分导致的歧义就大了。实验证明(张亚旭、 张厚粲、 舒华, 2000) , 人们更多地把它理解为一个名词短语 爱上老板的秘书,而不是动词爱上老板的秘5陆丙甫 蔡振光:“ 组块 ” 与语言结构难度书 。从组块的角度来说,名词短语 爱上1老板的1秘书1的MCN = (1 + 1 + 1) /3 = 1, 而动词短语爱上1老板的2秘书1 的MCN = (1 +2

14、 +1) /3 =1. 3。正是由于这里分析成 动词短语的难度大于分析成名词短语的难度,所以人们更倾向于把这种歧义结构理解为名词短语。 再看一个复杂一些的例子。用两分法分析,下面这个偏正结构有三种第一层次的基本 切分。(3)南昌大学 中文系 语言专业丨 研究生(4)南昌大学 中文系丨 语言专业 研究生(5)南昌大学丨 中文系 语言专业 研究生这些基本切分的下位层次上还存在多种切分的可能,因此,“ 南昌大学中文系语言专业 研究生 ” 可切分出以下五种结构层次:(3a) 南昌 大学 中文系 语言 专业丨 研究生MCN = (1 1 1 2 1 1 ) /6 =7/6 =1. 17(3b) 南昌 大

15、学 中文系 语言 专业丨 研究生MCN = (1 1 231 1 ) /6 =9 /6 =1. 50(4a) 南昌 大学 中文系丨 语言 专业 研究生MCN = (1 1 1 2 2 1 ) /6 =8 /6 =1. 33 (5a) 南昌 大学丨 中文系 语言 专业 研究生MCN = (1 1 2 3 2 1 ) /6 =10 /6 =1. 67 (5b) 南昌 大学丨 中文系 语言 专业 研究生MCN = (1 1 2 3 3 1) /6 =11/6 =1. 83 根据层次分析法,这五种切分都是符合要求的。根据组块计算,不同的切分,所得到的平均6世界汉语教学 第23卷2009年第1期块数MC

16、N是不同的。 可以看出(3a)的感知难度最低,其组块形式的特点是只要能组块的地方就“ 及时组块 ”(陆丙甫, 1993: 197)。也就是说,对于语句中既能同其前置成分直接结合、 又能同其后置成分结合的中间单位,降低处理难度的一个基本原则是先同其前置成分结合起来。及时组块反映了人类语言理解的即增性( incrementality) ,即当一个词语被读到时,会立刻被合并到句子中去。(Clifton et al . , 2003)事实上,“ 及时组块 ” 可以解释人类语言处理的很多现象。例如在英语的很多特殊疑问句中,疑问词会被提前到句首,如Who did John hit?实验表明,前置的疑问词会被尽快地整合到句子中去,例如,尽快地把例句中的who理解为hit的宾语。(Stowe, 1986; Frazier Va

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号