第五章行为学习理论一、巴甫洛夫的经典性条件作用理论Ivan Pavlov (1870 —1932)俄国生理学家、心理学家、高级神经活动学说的创始人1904年 因消化腺生理学研究的卓越贡献而获诺贝尔奖金他一生最突出的贡献是关于高级神经活动 的研究一) 狗的条件反射作用实验 实验结果(1) 条件作用之前:给出铃声(条件刺激)并无唾液分泌给出肉(无条件刺激)产生唾液分泌(2) 条件作用期间:铃声+肉(条件刺激+无条件刺激),产生唾液分泌(3) 条件作用之后:给出铃声(条件刺激),产生唾液分泌(二) 经典性条件作用的基本内容> 一个原是中性的刺激与一个原来就能引起某种反应的刺激相结合,而使动物学会对那个 中性刺激做出反应• 条件反射的四个基本事项:① 无条件刺激(UCS):指本来就能引起的某种固定反应的刺激② 无条件反应(UCR):指由无条件刺激原本就可以引起的固定反应③ 条件刺激(CS):原来的中性刺激④ 条件反应(CR):条件反射形成后由条件刺激引起的反应三) 学习规律1. 消退• 条件作用建立之后,如果多次只给条件刺激而不用无条件刺激加以强化,结果是条件作 用的反应强度逐渐减弱,最后将完全不出现。
• 巴甫洛夫认为,消退并不是条件刺激和相应的反应之间的暂时联系已经消失或中断,而 是暂时联系受到抑制• 条件作用愈巩固,消退速度就愈慢;条件作用愈不巩固,就愈容易消退2. 泛化:在条件作用开始建立时,除条件刺激本身外,那些与该刺激相似的刺激也或 多或少具有条件刺激的效应这种现象称为条件作用的泛化3. 分化:只对经常受到强化的刺激产生条件作用,而对其他近似刺激则产生抑制效应 这种现象称为条件作用的分化4•高级条件作用:中性刺激一旦成为条件刺激,可以作为无条件刺激另一个中性刺激 与其反复结合,可形成新的条件作用,这一过程被称为高级条件作用测验失败(中性刺激) 批评(条件刺激)——焦虑 测验失败——焦虑巴甫洛夫的信号系统理论• 巴甫洛夫认为,条件反射是一种信号活动,引起条件反射的刺激是信号刺激• 从本质上条件刺激可分为两类:⑴一类是现实的具体的刺激,称为第一信号⑵一类是现实的抽象刺激,称为第二信号第一信号系统:对第一信号发生反应的大脑皮层机能系统,将直接刺激转变为机体各种活 动的信号第二信号系统:对第二信号发生反应的大脑皮层机能系统,将第一信号系统的单纯刺激变 为具有抽象意义的语词的信号二、 华生的行为主义John B. Waston (1878-1958)美国心理学家,行为主义的创始人。
1900年入芝加哥大学研究哲学与心理学,师从教育哲学家J •杜威、心理学家J・R •安吉 尔等1908年受聘为霍普金斯大学正式教授1913年《行为主义者心目中的心理学》文章 发表,创立了革命性的行为主义心理学1915年当选美国心理学会主席1•观点:华生认为,学习就是以一种刺激替代另一种刺激建立条件反射的过程,通过条件反 射建立牢固的刺激一反应联结,从而形成了新的行为习惯2. 恐惧形成实验3. 华生的学习律频因率:在其他条件相等的情况下,某种行为练习得越多,习惯形成得就越迅速近因率:当反应频繁发生时,最新近的反应比较早的反应更容易得到强化总结1•经典性条件反射学习理论的基本观点:学习实质:有机体的学习就是通过经典性条件反射的建立,形成刺激与反应之间联结的过程 学习过程:一、学习就是形成刺激与反应之间的联系或联结二、联结的实现过程,是通过 条件刺激与无条件刺激在时空上结合产生了替代作用,使条件刺激与原来只能由无条件刺激 才能引起的反应建立了联系,这个过程也就是经典性条件反射的形成过程2. 巴、华理论简评优点:巴:经典条件反射揭示了学习活动最基本的生理机制华:将巴的理论引进学习领域,促成了该派学习理论的形成。
缺点:只能解释较简单的低级学习三、 桑代克的联结主义理论E.L. Thorndike (1874-1949)美国杰出的心理学家、动物心理学开山鼻祖、教育心理学之父、 联结心理学的创始人,个性古怪、孤独、内向,但喜欢读书,出版著作非常多,涉及的领域 广1903《教育心理学》 1913—1914《教育心理大纲》 饿猫出笼实验(一) 学习的基本观点学习的实质在于形成刺激(S)—(R)反应联结(无需观念作媒介,是一个直接过程)① 联结:指在某一刺激(刺激情景)下,只能引起一种反应而不能引起其他反应桑 代克认为人生来就具有许多联结的“原本趋向”所谓学习就是在一定情境下,唤起“原本 联结”中的一种联结倾向,并使之加强,而不唤起其他联结倾向或使其他联结倾向减弱② 联结是通过试误过程建立的试误说:认为联结是通过反复尝试从而逐渐减少错误而建立的,没有什么认识、理 解、意识的作用,因而是一个盲目的过程③ 人和动物遵循同样的学习律二) 桑代克的学习律1.准备律指学习者在学习开始时的预备定势学习者有准备而又给以活动就感到满意,有准备而不活动则感到烦恼,学习者无准备而 强制活动也感到烦恼当学生从发展水平上做好了准备时,那么促进这种学习的行为将是一种奖励;当学生从 发展水平上还没有做好学习的准备或不具有必备的技能时,让让他去学习就是一种惩罚。
2. 练习律(重复律)一个学会了的反应的重复将增加刺激反应之间的联结应用律:一个已形成的可变联结,若加以应用,就会变强;失用律:一个已形成的可变联结,若久不应用,就会变弱3•效果律如果一个动作跟随以情景中一个满意的变化,在类似的情景中这个动作重复的可能性将 增加;但是,如果跟随的是一个不满意的变化,这个行为重复的可能性将减少桑代克在 20世纪30年代进一步考察了这条定律,发现,感到满足比感到厌烦能产生更强的学习动机, 因此他修正了效果律,更强调奖赏,而不大强调惩罚• 桑代克的5条副律(或称为5条学习原则)(1) 多重反应律:学习者对同一刺激情景可能会做出多种多样的反应当某一反应不能产 生满意的效果时,就会做出其他反应,直到有一种反应最终导致满意的结果为止在桑代克 看来,多重反应的原则至少遍布动物和人类的90%的学习中2) 定势律:或称“态度”或“顺应”原则桑代克在实验中发现,动物可能会以某种特 定的态度对待某种外部情景,这取决于它的年龄、饥饿状态、精力状态或瞌睡程度等反应 是学习者态度的产物3) 选择性反应律:桑代克发现,有机体在学习时往往会有选择地对刺激情景中的某些要 素做出反应,而对其他要素不予理会。
鉴于在学习过程中,刺激情景的部分要素便能有效地 引起反应,桑代克有时又把这一学习律称为“部分活动”的原则4) 同化律:或称“类推”原则当有机体对新的刺激情景做出反应时,这种反应往往是 与他(它)在以往类似情境中习得的反应相类似的5) 联想性转化律:有机体已习得的对一组刺激的反应,可以逐渐转换成对一组新的刺激 的反应桑代克理论简评1•贡献:运用实验的方法研究学习 奠定了联结派学习理论的基础2•局限:简化了学习过程的性质,只能解释简单的机械学习,无法解释人类复杂的认知学习 未能揭示学习的意识性和能动性 未能区分人类学习与动物学习的本质区别四、斯金纳B.f.Skinner(1904-1990)的操作条件作用理论• 桑代克为操作性条件作用理论奠定了基础,斯金纳则系统地发展这一理论,并使之对教 育实践产生了巨大作用• “作为具有敏锐眼光和创造力的心理学家,斯金纳在心理学领域里发起了一场挑战传统 行为观的运动,并在这一领域唤起了许多创新美国心理学会)斯金纳的基本理论观点(一)操作性条件作用学说应答性行为:由先行的刺激所引发 操作性行为:由机体对环境发出的反应• 斯金纳把条件作用也分为两类:应答性条件作用(经典性条件作用) 反应性条件作用(操作性条件作用)操作条件作用:是指在一定的刺激情景中,有机体的某种反应结果能满足其某种需要, 以后在相同的情境中其反应概率就会提高的现象。
• 操作性条件作用理论是根据斯金纳用自己发明的一种学习装置“斯金纳箱” (skinner box)做的经典实验提出来的• 斯金纳认为,操作性条件作用与两个一般的原则相联系:① 任何反应如果随之紧跟强化(奖励)刺激,这个反应都有重复出现的倾向② 任何能提高操作反应率的刺激都是强化刺激经典条件反射提作条件反射反应类S—R型R S型強化的性质强化徉随着条件 刺澈"強化不是 奖赏应,強化是奖 赏反亚的主动性被 动毛 动学到了什么剌滋冋信号关系特定的反应适合于解祥信号学习 情绪孚习简单的技龍孚习(二) 学习观① 学习的实质:学习是指有机体的某种自发行为由于得到强化而提高了该行为在这种情境中 发生的概率,即形成了反应与情境的联系,从而获得了用这种反应应付该情景以寻求强化的 行为经验② 操作学习的过程:即操作性条件反射的形成过程,也就是反应一强化过程三) 强化理论强化:增强某个反应发生概率的一种程序或条件强化物:凡是能增强反应概率的刺激和事件都叫做强化物♦ 一级强化物:指满足人和动物的基本生理需要的刺激如食物、安全、温暖、性等♦ 二级强化物:与一级强化物反复联合,就能获得自身的强化性质的刺激♦ 二级强化物种类:社会强化物(社会接纳、微笑、荣誉)、代币强化物(分数、级别、 奖品)、活动强化物(自由地玩、听音乐、旅游)。
积极强化:呈现愉快刺激以提高一个反应的概率消极强化:终止或撤销厌恶刺激以提高一个反应发生的概率惩罚:反应之后呈现一个讨厌刺激或撤销愉快刺激,从而导致反应概率下降行为被増強行为被减弱呈现柬1激正強化(呈现愉快 刺激.如给子表扬〉惩罚I C呈现厌惡 刺激.如关奈闭〉消除刺澈负強化(消除厌悪 刺激,如免做家务o惩罚n (消除愉快 刺激.如禁吆KFO• 强化原则• 普雷马克原理:用高频的活动作为低频活动的强化物,或者说用学生喜爱的活动去强化 学生对不喜爱的活动的参与在实际教育中,不同学生对各种强化物的反应是不同的因此要注意:(1)要对不同的学生提供不同的强化物; (2)教师选择强化物时应考虑年龄因素• 强化程式• 强化程式:指反应受到强化的时机和频次• 强化程式的分类:连续强化程式与间隔强化程式间隔强化又分为时间式间隔和比率式间隔,分别又分为定时、变时和定比率、变比率• 不同的强化程式会产生不同的反应模式,连续强化有利于新知识的学习,而间隔强化有 利于知识的保持• 教学应注意:(1)教新任务时,要进行即时强化,不要进行延缓强化;(2)在任务的早期阶段应对每一个正确的反应都进行强化,随学习的进行逐渐转变为间隔强化;(3)不要一开始就要求做到十全十美,要朝正确的方向逐渐引导,增强学生的行为。
★操作条件反射在课堂中如何使用?(一)塑造良好行为1、 普雷马克原理2、 行为塑造3、 代币奖励4、 契约管理/新行为的塑造• 塑造:通过小步反馈帮助学生达到目标二)减少不良行为1、 消退和强化2、 惩罚3、 隔离或关禁闭4、 反应代价(课后做作业、放学留校)5、 厌足与消极练习• 斯金纳认为“教育就是塑造行为”采用连续接近的方法,对趋向于所要塑造的反应的 方向不断地给予强化,直到引出所需要的新行为• 塑造技术:连锁塑造和逆向连锁塑造具体内容参见教材P141—1。