日照市教科所张念成整理ppt

上传人:M****1 文档编号:567487850 上传时间:2024-07-20 格式:PPT 页数:288 大小:500KB
返回 下载 相关 举报
日照市教科所张念成整理ppt_第1页
第1页 / 共288页
日照市教科所张念成整理ppt_第2页
第2页 / 共288页
日照市教科所张念成整理ppt_第3页
第3页 / 共288页
日照市教科所张念成整理ppt_第4页
第4页 / 共288页
日照市教科所张念成整理ppt_第5页
第5页 / 共288页
点击查看更多>>
资源描述

《日照市教科所张念成整理ppt》由会员分享,可在线阅读,更多相关《日照市教科所张念成整理ppt(288页珍藏版)》请在金锄头文库上搜索。

1、日照市教科所日照市教科所 张念成张念成第九章第九章 教育测量与评价教育测量与评价1第一节第一节 教育测评概述教育测评概述一、教育测量一、教育测量(一)测量的定义(一)测量的定义测量是根据法则给事物分派数字。(史蒂测量是根据法则给事物分派数字。(史蒂文斯)文斯)测量这一定义包含了三个要素:测量这一定义包含了三个要素:1 1、法则、法则给事物的属性分派数字的依据给事物的属性分派数字的依据2 2、事物属性、事物属性测量的对象或目标测量的对象或目标3 3、数字、数字描述事物属性的符号描述事物属性的符号2(二)四种测量量表(二)四种测量量表量表一般称为测量工具。量表一般称为测量工具。1 1、名称量表、名

2、称量表(类别量表)最低水平的(类别量表)最低水平的一种量表一种量表它只是用数字表明事物的类别或性质不它只是用数字表明事物的类别或性质不同而已,没有任何数量大小的意义,不同而已,没有任何数量大小的意义,不能作数量化分析,也不能将之进行加减能作数量化分析,也不能将之进行加减乘除运算。乘除运算。2 2、等级量表、等级量表(顺序量表)(顺序量表)3用来描述各个类别的数字,不仅具有区分用来描述各个类别的数字,不仅具有区分性,而且还具有等级性(或顺序性),因性,而且还具有等级性(或顺序性),因此,量表上的数字之间能表示事物大小的此,量表上的数字之间能表示事物大小的位次关系,但不具有等距性和可加性,也位次关

3、系,但不具有等距性和可加性,也不能进行加减乘除运算。不能进行加减乘除运算。43 3、等距量表、等距量表量表上的数值不仅具有区分性、等级性,量表上的数值不仅具有区分性、等级性,还有等距性,这类量表上的数值只能作加还有等距性,这类量表上的数值只能作加减运算,不能作乘除运算。减运算,不能作乘除运算。4 4、比率量表、比率量表最高水平的量表最高水平的量表有相等单位和绝对零点,量表数值可以进有相等单位和绝对零点,量表数值可以进行加减乘除的四则运算。行加减乘除的四则运算。5(三)什么是教育测量(三)什么是教育测量教育测量就是依据一定的法则,对教育教育测量就是依据一定的法则,对教育活动中的某一现象给予数量化

4、的描述。活动中的某一现象给予数量化的描述。两个理论基础两个理论基础“凡物的存在必有其数量凡物的存在必有其数量”(桑代克)(桑代克)“凡有数量的东西都可以测量凡有数量的东西都可以测量”(麦柯尔)(麦柯尔)6教育测量的特点教育测量的特点测量结果的间接性和推断性测量结果的间接性和推断性测量对象的复杂性和模糊性测量对象的复杂性和模糊性测量目的的针对性测量目的的针对性度量单位的相对性度量单位的相对性7二、教育评价二、教育评价(一)教育评价的界定(一)教育评价的界定1 1、教育评价就是教育测验、教育评价就是教育测验2 2、教育评价是一种专业判断、教育评价是一种专业判断3 3、教育评价是把实际表现与理想目标

5、相、教育评价是把实际表现与理想目标相比较的活动比较的活动84 4、教育评价是系统收集资料,为决策提、教育评价是系统收集资料,为决策提供依据的活动供依据的活动教育评价:教育评价是根据一定的教育教育评价:教育评价是根据一定的教育目标,运用可行的科学手段,通过系统目标,运用可行的科学手段,通过系统地收集信息资料和分析整理,对教育活地收集信息资料和分析整理,对教育活动、教育过程和教育结果进行价值判断,动、教育过程和教育结果进行价值判断,从而为教育决策提供依据的过程。从而为教育决策提供依据的过程。9(二)教育评价的特征(二)教育评价的特征1 1、教育评价、教育评价= =事实判断事实判断+ +价值判断价值

6、判断2 2、教育评价是对教育过程及其结果的评、教育评价是对教育过程及其结果的评价价3 3、教育评价必须以教育目标为基准、教育评价必须以教育目标为基准4 4、教育评价是评价者与被评价者的双边、教育评价是评价者与被评价者的双边合作活动合作活动10(三)在区别上理解教育评价(三)在区别上理解教育评价1 1、教育评价与教育测量、教育评价与教育测量联系:联系:教育测量是教育评价的基础,教育测量是教育测量是教育评价的基础,教育测量是对教育进行量的测定,所获得的结果是教对教育进行量的测定,所获得的结果是教育评价所需信息的主要的、可靠的来源,育评价所需信息的主要的、可靠的来源,是对教育的状态和价值进行客观判断

7、的前是对教育的状态和价值进行客观判断的前提;提;教育测量的结果只有通过教育评价这个环教育测量的结果只有通过教育评价这个环节才能获得实际意义,否则便成了一堆抽节才能获得实际意义,否则便成了一堆抽象而枯燥的数字。象而枯燥的数字。11区别区别: 两者着眼点不同:教育测量是为了取得两者着眼点不同:教育测量是为了取得数据;教育评价是要分析解释,对教育价数据;教育评价是要分析解释,对教育价值作出判断。值作出判断。 两者特点不同:教育测量是一种纯客观两者特点不同:教育测量是一种纯客观的过程,具有客观性特点;教育评价具有的过程,具有客观性特点;教育评价具有客观性与主体性相结合特点。客观性与主体性相结合特点。

8、两者复杂程度不同:教育测量是对教育两者复杂程度不同:教育测量是对教育数量化的描述,关心量的获得,活动较为数量化的描述,关心量的获得,活动较为单一;教育评价着眼于事物质的判定,含单一;教育评价着眼于事物质的判定,含定性与定量分析,活动是多重的。定性与定量分析,活动是多重的。122 2、教育评价与教学评价、教育评价与教学评价联系联系:教学评价是以教学为对象的教育评价,只教学评价是以教学为对象的教育评价,只是教育评价的一个方面,用逻辑学术语讲,是教育评价的一个方面,用逻辑学术语讲,教育评价是一个上位概念,而教学评价仅教育评价是一个上位概念,而教学评价仅是一个下位概念。是一个下位概念。区别区别:教育评

9、价的范围比教学评价要广得多,它教育评价的范围比教学评价要广得多,它不仅关注教学评价,还有学校管理评价、不仅关注教学评价,还有学校管理评价、教师评价、学生评价、课程评价、总务评教师评价、学生评价、课程评价、总务评价等等。价等等。133 3、教育评价与教育督导、教育评价与教育督导联系联系:两者皆以党和国家的教育方针、政策、两者皆以党和国家的教育方针、政策、法规为依据;法规为依据;目的都是为了加强对教育工作的科学管目的都是为了加强对教育工作的科学管理,全面提高教育质量;理,全面提高教育质量;督导工作过程主要有监督、检查、评价、督导工作过程主要有监督、检查、评价、指导、反馈若干环节,评价是诸环节的指导

10、、反馈若干环节,评价是诸环节的核心,无论是监督和检查,还是指导和核心,无论是监督和检查,还是指导和反馈,都离不开评价这个手段。反馈,都离不开评价这个手段。14区别区别: 评价只是督导工作内容的一部分,只评价只是督导工作内容的一部分,只构成督导工作的前提和基础,而不是其构成督导工作的前提和基础,而不是其全部;全部; 督导工作中所使用的评价即督导评价督导工作中所使用的评价即督导评价是一种自上而下的他人评价,只是教育是一种自上而下的他人评价,只是教育评价的一种形式,而不是教育评价的全评价的一种形式,而不是教育评价的全部。部。15(四)教育评价的类别(四)教育评价的类别1 1、从、从评价主体评价主体上

11、分上分他人评价他人评价自我评价自我评价2 2、从、从评价标准评价标准上分上分相对评价相对评价绝对评价绝对评价内差异评价内差异评价163 3、从、从评价功能评价功能上分上分诊断性评价诊断性评价形成性评价形成性评价总结性评价总结性评价4 4、从、从评价方法评价方法上分上分定性评价定性评价定量评价定量评价17三、教育测评的发展阶段三、教育测评的发展阶段(一)(一)教育测量教育测量的发展阶段的发展阶段1 1、教育测量的萌芽阶段(、教育测量的萌芽阶段(18641864年以前)年以前)(1 1)中国中国古代教育测量古代教育测量中国是考试制度的发源地中国是考试制度的发源地根据学记记载,早在我国的西周时根据学

12、记记载,早在我国的西周时期,就实行了教育考评。所以,教育测期,就实行了教育考评。所以,教育测量发生的最早源头在中国。量发生的最早源头在中国。18中国科举制度的世界地位中国科举制度的世界地位科举考试始于隋,兴盛完备于唐,废于科举考试始于隋,兴盛完备于唐,废于清末,是我国实行时间最长的一种选士清末,是我国实行时间最长的一种选士制度,对我国乃至于对世界的考试制度制度,对我国乃至于对世界的考试制度有重要的影响。有重要的影响。科举制是通过分科考试来选取人才,采科举制是通过分科考试来选取人才,采用口试、贴经、墨义、策问、诗赋等方用口试、贴经、墨义、策问、诗赋等方法测试考生。法测试考生。19(2 2)西方西

13、方教育测量的发展教育测量的发展A A、教育测量的诞生、教育测量的诞生1818世纪以前的西方各国,由于学校尚未世纪以前的西方各国,由于学校尚未普及,学校考试主要是口试。普及,学校考试主要是口试。17201720年,英国剑桥大学首先以笔试替代年,英国剑桥大学首先以笔试替代口试,开西方学校考试笔试之先河。口试,开西方学校考试笔试之先河。18451845年,美国初等学校普及,学生人数年,美国初等学校普及,学生人数激增,对毕业生一一口试已不可能,于激增,对毕业生一一口试已不可能,于是,贺拉斯曼于是,贺拉斯曼于18471847年引进笔试,取代年引进笔试,取代口试。口试。20B B、教育测量的蓬勃兴起、教育

14、测量的蓬勃兴起1864186418641864年,英国格林威治医院附属学校的教师费年,英国格林威治医院附属学校的教师费年,英国格林威治医院附属学校的教师费年,英国格林威治医院附属学校的教师费舍,收集了许多学生成绩样本,汇集了一本舍,收集了许多学生成绩样本,汇集了一本舍,收集了许多学生成绩样本,汇集了一本舍,收集了许多学生成绩样本,汇集了一本量表集,作为度量学生各科成绩的标准,量表集,作为度量学生各科成绩的标准,量表集,作为度量学生各科成绩的标准,量表集,作为度量学生各科成绩的标准,这可以说是客观标准化测量的萌芽。这可以说是客观标准化测量的萌芽。这可以说是客观标准化测量的萌芽。这可以说是客观标准

15、化测量的萌芽。引起人们对测验问题极大关注的是美莱斯博士引起人们对测验问题极大关注的是美莱斯博士引起人们对测验问题极大关注的是美莱斯博士引起人们对测验问题极大关注的是美莱斯博士的拼字测验。的拼字测验。的拼字测验。的拼字测验。20202020世纪初,比纳智力量表推出,比纳被称为智世纪初,比纳智力量表推出,比纳被称为智世纪初,比纳智力量表推出,比纳被称为智世纪初,比纳智力量表推出,比纳被称为智力测量鼻祖。力测量鼻祖。力测量鼻祖。力测量鼻祖。1904190419041904年,美国心理学家桑代克出版心理与社年,美国心理学家桑代克出版心理与社年,美国心理学家桑代克出版心理与社年,美国心理学家桑代克出版心

16、理与社会测量学导论,桑代克被称为教育测量鼻祖会测量学导论,桑代克被称为教育测量鼻祖会测量学导论,桑代克被称为教育测量鼻祖会测量学导论,桑代克被称为教育测量鼻祖21C C、教育测量的深入发展、教育测量的深入发展教育测量量表的编制突破了过去单一答案的求教育测量量表的编制突破了过去单一答案的求教育测量量表的编制突破了过去单一答案的求教育测量量表的编制突破了过去单一答案的求同思维题,发展到有了求异思维题和论文题;同思维题,发展到有了求异思维题和论文题;同思维题,发展到有了求异思维题和论文题;同思维题,发展到有了求异思维题和论文题;教育测量范围由过去偏重于学生学习成绩的测教育测量范围由过去偏重于学生学习

17、成绩的测教育测量范围由过去偏重于学生学习成绩的测教育测量范围由过去偏重于学生学习成绩的测量,发展到涉及课程设计、教材、教育改革方量,发展到涉及课程设计、教材、教育改革方量,发展到涉及课程设计、教材、教育改革方量,发展到涉及课程设计、教材、教育改革方案等的测量;案等的测量;案等的测量;案等的测量;教育测量由过去单一的常模参照性测验模式,教育测量由过去单一的常模参照性测验模式,教育测量由过去单一的常模参照性测验模式,教育测量由过去单一的常模参照性测验模式,发展到常模参照性测验与目标参照性测验相结发展到常模参照性测验与目标参照性测验相结发展到常模参照性测验与目标参照性测验相结发展到常模参照性测验与目

18、标参照性测验相结合的模式;合的模式;合的模式;合的模式;教育测量本身的理论研究与技术开发更加深入教育测量本身的理论研究与技术开发更加深入教育测量本身的理论研究与技术开发更加深入教育测量本身的理论研究与技术开发更加深入与完善。与完善。与完善。与完善。22(二)(二)教育评价教育评价的发展的发展1 1、现代教育评价的产生、现代教育评价的产生教育评价产生于本世纪教育评价产生于本世纪3030年代对美国测年代对美国测量运动的反思与批判。量运动的反思与批判。教育评价产生的标志是教育评价产生的标志是“八年研究八年研究”。泰勒提出了教育评价的概念,且提出了泰勒提出了教育评价的概念,且提出了以教育目标为核心的教

19、育评价理论,泰以教育目标为核心的教育评价理论,泰勒被称为勒被称为“教育评价鼻祖教育评价鼻祖”。232 2、现代教育评价的发展阶段、现代教育评价的发展阶段初步发展时期(初步发展时期(1930195819301958年)年)这一阶段教育评价仍然受泰勒模式的影这一阶段教育评价仍然受泰勒模式的影响,注重教育目标的研究;响,注重教育目标的研究;迅速发展时期(迅速发展时期(1958197219581972年)年)这一阶段泰勒模式受到挑战,出现了不这一阶段泰勒模式受到挑战,出现了不少新的教育评价理论与模式;少新的教育评价理论与模式;专业化发展阶段(专业化发展阶段(19731973年以后)年以后)这时期教育评

20、价发展具有一个显著特点:这时期教育评价发展具有一个显著特点:就是走向专业化。就是走向专业化。24第二节第二节 教育测量的质量指标教育测量的质量指标衡量教育测量的质量,可采用四个指标:衡量教育测量的质量,可采用四个指标: 信度信度 主要对整个测量而言。主要对整个测量而言。 效度效度 难度难度 主要对测量的项目而言。主要对测量的项目而言。 区分度区分度 25一、信度概述一、信度概述(一)什么是信度(一)什么是信度信度是指测量结果的稳定性或可靠性程度。信度是指测量结果的稳定性或可靠性程度。一般地说,一个好的测量必须具有较高的信度,一般地说,一个好的测量必须具有较高的信度,也就是说,一个好的测量工具,

21、只要遵守操作也就是说,一个好的测量工具,只要遵守操作规则,其结果就不应随工具的使用者或使用时规则,其结果就不应随工具的使用者或使用时间等方面的变化而发生较大的变化。间等方面的变化而发生较大的变化。必须从以下两个方面去理解测量的信度:必须从以下两个方面去理解测量的信度:信度指实测值(信度指实测值(X X)和真值()和真值(T T)相差的程度;)相差的程度;信度指两次重复测量或等值测量之间的关联程信度指两次重复测量或等值测量之间的关联程度。度。26(二)信度的估计方法(二)信度的估计方法1 1、重复信度(再测信度)、重复信度(再测信度)指的是同一个量表对同一组被试施测两指的是同一个量表对同一组被试

22、施测两次所得结果的一致性程度。次所得结果的一致性程度。其大小等于同一组被试在两次测验上所其大小等于同一组被试在两次测验上所得分数的相关系数,一般采用皮尔逊积得分数的相关系数,一般采用皮尔逊积差相关的公式来计算。差相关的公式来计算。27积差相关系数用积差相关系数用r表示表示式中式中xX y=Y N为成对数为成对数据的数目据的数目Sx为为X变量的标准差,变量的标准差,Sy为为Y变量的标变量的标准差。准差。28例一例一用一个算术四则的速度测验用一个算术四则的速度测验1212个小学生,个小学生,得分记为得分记为X X,为了考察测量结果的可靠性,为了考察测量结果的可靠性,于于3 3个月后再测一次,得分记

23、为个月后再测一次,得分记为Y Y,问测验,问测验结果是否可靠?结果是否可靠?学生序号学生序号 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10 11 1210 11 12X 20 20 21 22 23 23 X 20 20 21 22 23 23 232425262627232425262627Y 20 21 21 20 23 23 Y 20 21 21 20 23 23 25252626272925252626272929在使用重测法计算稳定性系数时,应在使用重测法计算稳定性系数时,应注意以下问题:注意以下问题:1 1、信度的取值范围为、信度的取值范围为00,1

24、1,当信度值,当信度值较大时,说明前后两次测量结果比较一较大时,说明前后两次测量结果比较一致;致;2 2、两次测验之间的时间间隔要适宜。应、两次测验之间的时间间隔要适宜。应由测验的性质、测题类型、测题数量和由测验的性质、测题类型、测题数量和被试特点所决定;被试特点所决定;3 3、重测法适用于速度测验而不适用于难、重测法适用于速度测验而不适用于难度测验;度测验;4 4、应注意提高被试者的积极性。、应注意提高被试者的积极性。302 2、复本信度、复本信度指的是两个平等的测验测量同一批被试指的是两个平等的测验测量同一批被试所得结果的一致性程度。所得结果的一致性程度。其大小等于同一批被试在两个复本测验

25、其大小等于同一批被试在两个复本测验上所得分数的相关系数。上所得分数的相关系数。所谓复本测验是指在性质、内容、题型、所谓复本测验是指在性质、内容、题型、题数、难度等方面都一致(或相等)的题数、难度等方面都一致(或相等)的两份或多份测验。两份或多份测验。31例二例二以以A A、B B两型英语复本测验对初中三年级两型英语复本测验对初中三年级1010个学生施测,为避免由测验施测顺序个学生施测,为避免由测验施测顺序所造成的误差,其中所造成的误差,其中5 5个学生先做个学生先做A A型测型测验,休息验,休息1515分钟后,再做分钟后,再做B B型测验;而另型测验;而另5 5个学生先做个学生先做B B型测验

26、,休息型测验,休息1515分钟后,分钟后,再做再做A A型测验。型测验。1010个学生个学生A A型测验结果记型测验结果记为为X X,B B型测验结果记为型测验结果记为Y Y,其测验的复本,其测验的复本信度如何?信度如何?32学生序号 1 2 3 4 5 6 7 8 9 10X 19 19 18 17 16 15 15 14 13 12Y 20 17 18 18 17 15 13 15 12 1233复本信度的优缺点表现:优点:优点:1 1、测验的两个复本,如果在不同的时间使用,、测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可其信度既可以反映在不同时间的稳定性,

27、又可以反映对于不同测题的一致性;以反映对于不同测题的一致性;2 2、两个复本在同时使用时,可以避免再测信、两个复本在同时使用时,可以避免再测信息的一些缺点,如首测时再测在记忆、练习、息的一些缺点,如首测时再测在记忆、练习、效果的影响,间隔期间获得新知识的影响,两效果的影响,间隔期间获得新知识的影响,两次施测的环境不同和被试主观状态不同的影响,次施测的环境不同和被试主观状态不同的影响,以及为了应付测验所作训练的影响等。以及为了应付测验所作训练的影响等。34缺点:1 1、编制两个完全相等的测验是很困难的,如、编制两个完全相等的测验是很困难的,如果两个复本过分相似,则变成再测形式,而过果两个复本过分

28、相似,则变成再测形式,而过分不相似,又使等值的条件不存在;分不相似,又使等值的条件不存在;2 2、两个复本测验有可能在某种程度上测量了、两个复本测验有可能在某种程度上测量了不同的性质,这就会低估测验的信度;不同的性质,这就会低估测验的信度;3 3、被试同时接受性质相似的两个测验,可能、被试同时接受性质相似的两个测验,可能减少完成测验的积极性;减少完成测验的积极性;4 4、虽然两个复本测验的题目材料不同,但被、虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。有可能失去复本的意义。353、折半信度(分半信

29、度)就是将测验分半,再求被试在每一半测验上所就是将测验分半,再求被试在每一半测验上所得分数的相关系数。得分数的相关系数。首先根据内容、形式、题数、平均数、标准差、首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则,难度、测题间相关以及分布形态相等的原则,将试题分成两半,或者将从易到难排列的测题,将试题分成两半,或者将从易到难排列的测题,按照测题序号,奇数测题为一组,偶数测题为按照测题序号,奇数测题为一组,偶数测题为一组,分成两半;一组,分成两半;然后计算每个被试在两个分半测验分数的积差然后计算每个被试在两个分半测验分数的积差相关系数,再用斯皮尔曼相关系数,再用斯皮

30、尔曼布朗公式加以校正。布朗公式加以校正。斯皮尔曼斯皮尔曼布朗公式为布朗公式为36例三 对初中一年级学生进行地理成绩测验,每答对对初中一年级学生进行地理成绩测验,每答对1 1题得题得1 1分,答错分,答错1 1题题得得0 0分,其测验结果如下表,试估计该测验的折半信度?分,其测验结果如下表,试估计该测验的折半信度? 学生序号学生序号 题题 序序 1 2 3 4 5 6 1 2 3 4 5 6 1 1 0 0 0 0 01 1 0 0 0 0 0 2 0 0 0 1 0 02 0 0 0 1 0 0 3 1 0 1 0 0 03 1 0 1 0 0 0 4 1 1 0 0 1 04 1 1 0 0

31、 1 0 5 1 0 0 1 0 05 1 0 0 1 0 0 6 1 1 1 0 1 16 1 1 1 0 1 1 7 1 1 1 1 0 17 1 1 1 1 0 1 8 1 1 0 1 1 08 1 1 0 1 1 0 9 0 1 1 0 0 19 0 1 1 0 0 1 10 1 1 1 1 1 110 1 1 1 1 1 137作业1、用某量表测验10名学生,得分记为X,为了考察结果的可靠性,于15天后用原量表对这10个学生重测一次,得分记为Y,问测验结果是否可靠?学生序号 1 2 3 4 5 6 7 8 9 10X 8 10 9 6 10 7 5 7 9 4Y 9 10 10 6

32、10 8 4 8 9 4382、对10名应试者先进行某种测验X,隔适当时间后(半年),再进行内容、范围、难度类似的第二次测验Y,试求测验的复本信度?应试者 1 2 3 4 5 6 7 8 9 10X 9 10 10 6 10 8 4 8 9 4Y 4 9 7 9 4 3 5 3 2 4393、有一个由100题构成的量表施行于10个高三学生(分数见下表)。测验一次后,学生即毕业离校,现怎样评价测验结果的信度?学生序号 1 2 3 4 5 6 7 8 9 10奇X 38 37 38 41 40 36 38 39 40 35偶Y 37 37 36 39 39 34 38 39 39 3640(三)提

33、高信度的方法(三)提高信度的方法1 1、影响测量信度的主要因素、影响测量信度的主要因素(1 1)被试方面)被试方面(2 2)主试方面)主试方面(3 3)施测情境方面)施测情境方面(4 4)测量工具方面)测量工具方面(5 5)两次施测的间隔时间方面)两次施测的间隔时间方面412 2、提高测量信度的常用方法、提高测量信度的常用方法(1 1)适当增加测验的长度)适当增加测验的长度(2 2)测验的难度要适中)测验的难度要适中(3 3)测验的内容应尽量同质)测验的内容应尽量同质(4 4)测验的程序应统一)测验的程序应统一(5 5)测验的时间要充分)测验的时间要充分(6 6)测验的评分要尽量做到客观化,减

34、)测验的评分要尽量做到客观化,减少评分误差少评分误差42二、效度的概念二、效度的概念(一)什么是效度(一)什么是效度效度是指测量结果的准确性和有效性的程度。效度是指测量结果的准确性和有效性的程度。效度是指测量结果的准确性和有效性的程度。效度是指测量结果的准确性和有效性的程度。也可以说是测量是否达到了预期的目的。也可以说是测量是否达到了预期的目的。也可以说是测量是否达到了预期的目的。也可以说是测量是否达到了预期的目的。1 1 1 1、效度是一个相对的概念。、效度是一个相对的概念。、效度是一个相对的概念。、效度是一个相对的概念。(1 1 1 1)测量的效度是相对一定的测量目的而言)测量的效度是相对

35、一定的测量目的而言)测量的效度是相对一定的测量目的而言)测量的效度是相对一定的测量目的而言的的的的(2 2 2 2)测量的效度是相对测量的结果而言的)测量的效度是相对测量的结果而言的)测量的效度是相对测量的结果而言的)测量的效度是相对测量的结果而言的2 2 2 2、一种测量的效度只是高或低的问题、一种测量的效度只是高或低的问题、一种测量的效度只是高或低的问题、一种测量的效度只是高或低的问题测量结果总是有一定效度的,只是效度高低不测量结果总是有一定效度的,只是效度高低不测量结果总是有一定效度的,只是效度高低不测量结果总是有一定效度的,只是效度高低不同罢了。同罢了。同罢了。同罢了。43(二)效度的

36、估计(二)效度的估计效度估计就是多方寻找证据来证明一个测验的效度估计就是多方寻找证据来证明一个测验的效度估计就是多方寻找证据来证明一个测验的效度估计就是多方寻找证据来证明一个测验的有效性程度的过程。有效性程度的过程。有效性程度的过程。有效性程度的过程。1 1 1 1、内容效度、内容效度、内容效度、内容效度就是指测验内容对所要测量的内容的代表性程就是指测验内容对所要测量的内容的代表性程就是指测验内容对所要测量的内容的代表性程就是指测验内容对所要测量的内容的代表性程度。也就是说,测验的内容范围、材料与所要度。也就是说,测验的内容范围、材料与所要度。也就是说,测验的内容范围、材料与所要度。也就是说,

37、测验的内容范围、材料与所要测量的内容范围、教育目标是否相符合;测验测量的内容范围、教育目标是否相符合;测验测量的内容范围、教育目标是否相符合;测验测量的内容范围、教育目标是否相符合;测验中测题所引起的行为是否是所要测量的属性的中测题所引起的行为是否是所要测量的属性的中测题所引起的行为是否是所要测量的属性的中测题所引起的行为是否是所要测量的属性的明确反应;测验的结果是否是一个有代表性的明确反应;测验的结果是否是一个有代表性的明确反应;测验的结果是否是一个有代表性的明确反应;测验的结果是否是一个有代表性的行为样本。行为样本。行为样本。行为样本。为了使测验的内容具有有效性,成为所欲测量为了使测验的内

38、容具有有效性,成为所欲测量为了使测验的内容具有有效性,成为所欲测量为了使测验的内容具有有效性,成为所欲测量内容的一个具有代表性的行为样本,在编制测内容的一个具有代表性的行为样本,在编制测内容的一个具有代表性的行为样本,在编制测内容的一个具有代表性的行为样本,在编制测验时,就要考虑建立内容效度的问题。验时,就要考虑建立内容效度的问题。验时,就要考虑建立内容效度的问题。验时,就要考虑建立内容效度的问题。442 2、内容效度的估计、内容效度的估计(1 1 1 1)逻辑分析法)逻辑分析法)逻辑分析法)逻辑分析法其工作思路是请有关专家对测验题目与原定内其工作思路是请有关专家对测验题目与原定内其工作思路是

39、请有关专家对测验题目与原定内其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。容范围的吻合程度作出判断。容范围的吻合程度作出判断。容范围的吻合程度作出判断。(2 2 2 2)统计分析法)统计分析法)统计分析法)统计分析法从同一个教学内容总体中抽取两套独立的平行从同一个教学内容总体中抽取两套独立的平行从同一个教学内容总体中抽取两套独立的平行从同一个教学内容总体中抽取两套独立的平行测验,用这两个测验来测同一批被试,求其相测验,用这两个测验来测同一批被试,求其相测验,用这两个测验来测同一批被试,求其相测验,用这两个测验来测同一批被试,求其相关。若相关高,表明测验内容效度较高;若相关。

40、若相关高,表明测验内容效度较高;若相关。若相关高,表明测验内容效度较高;若相关。若相关高,表明测验内容效度较高;若相关低,表示测验的内容效度较低。关低,表示测验的内容效度较低。关低,表示测验的内容效度较低。关低,表示测验的内容效度较低。采用求统计量的公式进行计算采用求统计量的公式进行计算采用求统计量的公式进行计算采用求统计量的公式进行计算. . . .45例一例一在社会发展史某一单元教学之前,对学在社会发展史某一单元教学之前,对学生进行有关这一单元内容的测验。教学之后,生进行有关这一单元内容的测验。教学之后,再以复本测验施测,两次测验分数如下,试再以复本测验施测,两次测验分数如下,试检定测验的

41、内容效度?检定测验的内容效度?学生序号学生序号 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10教学前教学前X 34 40 32 30 31 35 44 33 42 36X 34 40 32 30 31 35 44 33 42 36教学后教学后Y 52 64 50 54 58 63 72 62 62 50Y 52 64 50 54 58 63 72 62 62 5046结论结论然后根据自由度然后根据自由度df=N-1=9,df=N-1=9,查查t t值表,寻值表,寻得得0.010.01显著性水平显著性水平t t的双侧临界值为的双侧临界值为t t(9 9)0.0

42、1=4.7810.01=4.781,而实际计算出的,而实际计算出的t=13.94.781=t(9)0.01t=13.94.781=t(9)0.01,于是可以说,于是可以说,教学前后学生在两个复本测验上得分的教学前后学生在两个复本测验上得分的平均数有极显著性差异,从而可以作出平均数有极显著性差异,从而可以作出判断,社会发展史中该单元测验的判断,社会发展史中该单元测验的内容具有有效性,或内容效度较高。内容具有有效性,或内容效度较高。47内容效度主要应用于成就测验、学科测内容效度主要应用于成就测验、学科测验、选拔和分类职业测验。验、选拔和分类职业测验。内容效度不适合用于能力倾向和人格测内容效度不适合

43、用于能力倾向和人格测验。验。482 2、结构效度、结构效度是指测验对于人的心理特性或理论概念是指测验对于人的心理特性或理论概念测量到的程度。通常用某种测量到的程度。通常用某种操作操作来定义,来定义,并用测验来测量。并用测验来测量。例如:例如:人的创造力可以分解为人的思维人的创造力可以分解为人的思维流畅性、灵活性和创造性三大特性,并流畅性、灵活性和创造性三大特性,并根据这三大特性编制测验,若有足够的根据这三大特性编制测验,若有足够的证据来证明该测验确实可以测到这些特证据来证明该测验确实可以测到这些特性,则认为该测验是个性,则认为该测验是个结构效度结构效度较高的较高的创造力测验。创造力测验。49(

44、1 1)结构效度的特点)结构效度的特点结构效度的大小完全取决于事先假定的心理特结构效度的大小完全取决于事先假定的心理特结构效度的大小完全取决于事先假定的心理特结构效度的大小完全取决于事先假定的心理特质理论,一旦人们对同一种心理特质有着不同质理论,一旦人们对同一种心理特质有着不同质理论,一旦人们对同一种心理特质有着不同质理论,一旦人们对同一种心理特质有着不同的定义或假设,则会使得关于特质测验的结构的定义或假设,则会使得关于特质测验的结构的定义或假设,则会使得关于特质测验的结构的定义或假设,则会使得关于特质测验的结构效度的研究结果无法比较。效度的研究结果无法比较。效度的研究结果无法比较。效度的研究

45、结果无法比较。当实际测量的资料无法证实我们的理论假设时,当实际测量的资料无法证实我们的理论假设时,当实际测量的资料无法证实我们的理论假设时,当实际测量的资料无法证实我们的理论假设时,并不一定就表明该测验结构效度高。因为还有并不一定就表明该测验结构效度高。因为还有并不一定就表明该测验结构效度高。因为还有并不一定就表明该测验结构效度高。因为还有可能出现理论假设不成立,或者该实验设计不可能出现理论假设不成立,或者该实验设计不可能出现理论假设不成立,或者该实验设计不可能出现理论假设不成立,或者该实验设计不能对该假设作适当的检查等情况,这就使得结能对该假设作适当的检查等情况,这就使得结能对该假设作适当的

46、检查等情况,这就使得结能对该假设作适当的检查等情况,这就使得结构效度的获取更为困难。构效度的获取更为困难。构效度的获取更为困难。构效度的获取更为困难。50(2 2)建立结构效度的步骤)建立结构效度的步骤A A、提出理论假设;、提出理论假设;B B、根据、根据假设结构假设结构拟定测题,编制测验;拟定测题,编制测验;C C、以测验结果为根据来验证、以测验结果为根据来验证假设结构假设结构中中的各种因素是否成立。的各种因素是否成立。51(3 3)结构效度的估计)结构效度的估计A A A A、因素分析法、因素分析法、因素分析法、因素分析法其目的是把一些具有错综复杂关系的因素归结其目的是把一些具有错综复杂

47、关系的因素归结其目的是把一些具有错综复杂关系的因素归结其目的是把一些具有错综复杂关系的因素归结为数量较少的几个综合因素或称共同因素,并为数量较少的几个综合因素或称共同因素,并为数量较少的几个综合因素或称共同因素,并为数量较少的几个综合因素或称共同因素,并以此测验所测之特质对测验分数作出解释。以此测验所测之特质对测验分数作出解释。以此测验所测之特质对测验分数作出解释。以此测验所测之特质对测验分数作出解释。B B B B、多元特质多重方法矩阵法、多元特质多重方法矩阵法、多元特质多重方法矩阵法、多元特质多重方法矩阵法是由肯贝尔和菲斯克是由肯贝尔和菲斯克是由肯贝尔和菲斯克是由肯贝尔和菲斯克195919

48、5919591959年提出的最受欢迎的年提出的最受欢迎的年提出的最受欢迎的年提出的最受欢迎的一种结构效度的评估方法。一种结构效度的评估方法。一种结构效度的评估方法。一种结构效度的评估方法。这种方法的设想:若采用两种方法以上的方法这种方法的设想:若采用两种方法以上的方法这种方法的设想:若采用两种方法以上的方法这种方法的设想:若采用两种方法以上的方法去测量两种以上的特质,那么这些测量结果之去测量两种以上的特质,那么这些测量结果之去测量两种以上的特质,那么这些测量结果之去测量两种以上的特质,那么这些测量结果之间可以形成一个多元特质多重方法矩阵。间可以形成一个多元特质多重方法矩阵。间可以形成一个多元特

49、质多重方法矩阵。间可以形成一个多元特质多重方法矩阵。52从理论上说,以不同方法测量同一特质的从理论上说,以不同方法测量同一特质的相关应当为最高;以相同方法测量不同特相关应当为最高;以相同方法测量不同特质的相关次之;以不同方法测量不同特质质的相关次之;以不同方法测量不同特质的相关为最低。的相关为最低。与内容效度不同,结构效度主要用于智力与内容效度不同,结构效度主要用于智力测验、人格测验等一些心理测验方面。测验、人格测验等一些心理测验方面。533 3、效标关联效度、效标关联效度是以测验分数和效标之间的相关系数来表示测是以测验分数和效标之间的相关系数来表示测是以测验分数和效标之间的相关系数来表示测是

50、以测验分数和效标之间的相关系数来表示测验效度高低的方法。验效度高低的方法。验效度高低的方法。验效度高低的方法。例如:例如:例如:例如:某年全国高考物理学科的测验效度,可某年全国高考物理学科的测验效度,可某年全国高考物理学科的测验效度,可某年全国高考物理学科的测验效度,可用大学一年级物理学科的测验分数为效标,然用大学一年级物理学科的测验分数为效标,然用大学一年级物理学科的测验分数为效标,然用大学一年级物理学科的测验分数为效标,然后求同一组学生高考物理得分与大一物理得分后求同一组学生高考物理得分与大一物理得分后求同一组学生高考物理得分与大一物理得分后求同一组学生高考物理得分与大一物理得分之间的相关

51、,此之间的相关,此之间的相关,此之间的相关,此相关系数相关系数相关系数相关系数就是该年高考物理测就是该年高考物理测就是该年高考物理测就是该年高考物理测验的验的验的验的效标关联效度效标关联效度效标关联效度效标关联效度系数。当这个相关系数与总系数。当这个相关系数与总系数。当这个相关系数与总系数。当这个相关系数与总体零相关有显著性差异时,相关系数的值(正体零相关有显著性差异时,相关系数的值(正体零相关有显著性差异时,相关系数的值(正体零相关有显著性差异时,相关系数的值(正值)越大,效度就越高;相关系数的值越小,值)越大,效度就越高;相关系数的值越小,值)越大,效度就越高;相关系数的值越小,值)越大,

52、效度就越高;相关系数的值越小,效度就越低。效度就越低。效度就越低。效度就越低。54效标不仅随测验的种类不同而不同,而且可能随效标不仅随测验的种类不同而不同,而且可能随效标不仅随测验的种类不同而不同,而且可能随效标不仅随测验的种类不同而不同,而且可能随时间而改变,现在是一个好的成功的效标,将来时间而改变,现在是一个好的成功的效标,将来时间而改变,现在是一个好的成功的效标,将来时间而改变,现在是一个好的成功的效标,将来就不一定是。所以,为某个测验选择一个最有效就不一定是。所以,为某个测验选择一个最有效就不一定是。所以,为某个测验选择一个最有效就不一定是。所以,为某个测验选择一个最有效的效标,这是最

53、重要的事情。的效标,这是最重要的事情。的效标,这是最重要的事情。的效标,这是最重要的事情。教育测验教育测验教育测验教育测验的效标,可采用各学科成绩和教师评定的效标,可采用各学科成绩和教师评定的效标,可采用各学科成绩和教师评定的效标,可采用各学科成绩和教师评定的结果;的结果;的结果;的结果;智力测验智力测验智力测验智力测验的效标,可采用学科成绩、教师评判的的效标,可采用学科成绩、教师评判的的效标,可采用学科成绩、教师评判的的效标,可采用学科成绩、教师评判的结果、学生总成绩、受教育年限、年龄以及其他结果、学生总成绩、受教育年限、年龄以及其他结果、学生总成绩、受教育年限、年龄以及其他结果、学生总成绩

54、、受教育年限、年龄以及其他事物;事物;事物;事物;能力倾向测验能力倾向测验能力倾向测验能力倾向测验的效标,可采用特殊课程或特殊训的效标,可采用特殊课程或特殊训的效标,可采用特殊课程或特殊训的效标,可采用特殊课程或特殊训练的成绩;练的成绩;练的成绩;练的成绩;职业兴趣测验职业兴趣测验职业兴趣测验职业兴趣测验的效标,可采用从业人员实际服务的效标,可采用从业人员实际服务的效标,可采用从业人员实际服务的效标,可采用从业人员实际服务成绩或记录;成绩或记录;成绩或记录;成绩或记录;人格测验人格测验人格测验人格测验的效标,可采用编制者的主观标准,或的效标,可采用编制者的主观标准,或的效标,可采用编制者的主观

55、标准,或的效标,可采用编制者的主观标准,或以被试以后行为或临床资料。以被试以后行为或临床资料。以被试以后行为或临床资料。以被试以后行为或临床资料。55效标关联效度的估计方法效标关联效度的估计方法(1 1)相关法)相关法由于测验分数和效标分数这两个变量的类型不同,由于测验分数和效标分数这两个变量的类型不同,由于测验分数和效标分数这两个变量的类型不同,由于测验分数和效标分数这两个变量的类型不同,二者相关系数的计算方法也就不同。二者相关系数的计算方法也就不同。二者相关系数的计算方法也就不同。二者相关系数的计算方法也就不同。A A、积差相关法:、积差相关法:适用于两个变量为连续变量适用于两个变量为连续

56、变量适用于两个变量为连续变量适用于两个变量为连续变量进行显著性检验:进行显著性检验:进行显著性检验:进行显著性检验:自由度自由度自由度自由度df=N-2df=N-2df=N-2df=N-2,检验的是两个变量,都减去,检验的是两个变量,都减去,检验的是两个变量,都减去,检验的是两个变量,都减去2 2 2 2;置信度取置信度取置信度取置信度取0.050.050.050.05,查相关系数界值表,寻找临界值;,查相关系数界值表,寻找临界值;,查相关系数界值表,寻找临界值;,查相关系数界值表,寻找临界值;结论:结论:结论:结论:rrrr临界值,说明显著相关,效度高;临界值,说明显著相关,效度高;临界值,

57、说明显著相关,效度高;临界值,说明显著相关,效度高;rrrr0D0D0D0为正区分,为正区分,为正区分,为正区分,D0D0D0D0为负区分,为负区分,为负区分,为负区分,D=0D=0D=0D=0为零区为零区为零区为零区分分分分76(二)区分度的计算(二)区分度的计算1 1、极端分组法、极端分组法(1 1)客观性试题)客观性试题D=PH-PL例6:有道试题,高分组有70%学生通过,低分组有30%的学生通过;而另一道题,高分组有40%学生通过,低分组有70%学生通过,求两题的各自区分度?77(2)主观题D=(XH-XL)/N(H-L)XH为高分组得分总数XL为低分组得分总数H为该道题的最高分L为该

58、道题的最低分N为应试总人数的27%。78例7 高分组 低分组得分X 人次f 得分X 人次f 5 4 5 0 4 3 4 1 3 2 3 1 2 1 2 3 1 0 1 4 0 0 0 4792、相关法点二列相关法例8:15个学生在数学测验中得分记录如下,计算数学测验中第一题的区分度? 学生学生 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1510 11 12 13 14 15 测验测验 65 70 31 49 80 50 35 10 81 69 78 55 65 70 31 49 80 50 35 10 81 69 78 55 77 9

59、0 4277 90 42 第一题第一题 0 1 0 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0 1 1 0 1 1 01 0 1 1 080二列相关例9:已知一测验中某选择题的通过率为0.5,答对者的测验总分平均为76分,答错者的测验总分平均为63分,全体被试20人总分的标准差为16,求该题的区分度?81(三)提高区分度的方法(三)提高区分度的方法1 1 1 1、使题目的难度适中,使整个考试难度适中、使题目的难度适中,使整个考试难度适中、使题目的难度适中,使整个考试难度适中、使题目的难度适中,使整个考试难度适中题目的难度适中可使区分度达到最大值,因此,题目的难度适中可使区分

60、度达到最大值,因此,题目的难度适中可使区分度达到最大值,因此,题目的难度适中可使区分度达到最大值,因此,使难度适中是提高区分度的重要方法。使难度适中是提高区分度的重要方法。使难度适中是提高区分度的重要方法。使难度适中是提高区分度的重要方法。2 2 2 2、着重考察复杂的学习结果、着重考察复杂的学习结果、着重考察复杂的学习结果、着重考察复杂的学习结果使高能学生得高分或低能学生得低分,使分数使高能学生得高分或低能学生得低分,使分数使高能学生得高分或低能学生得低分,使分数使高能学生得高分或低能学生得低分,使分数尽量分布在整个分数量尺上。尽量分布在整个分数量尺上。尽量分布在整个分数量尺上。尽量分布在整

61、个分数量尺上。3 3 3 3、掌握区分度的评价标准。、掌握区分度的评价标准。、掌握区分度的评价标准。、掌握区分度的评价标准。82第十章教育测验的编制与实施第十章教育测验的编制与实施一、教育测验编制的一般程序一、教育测验编制的一般程序(一)确定测验目标(一)确定测验目标1 1、什么是测验目标、什么是测验目标测验目标是测验编制者所编制的测验所测验目标是测验编制者所编制的测验所要达到的某种具体的目的。它明确规定要达到的某种具体的目的。它明确规定测验所要达到的预期结果或标准。测验所要达到的预期结果或标准。确定测验目标是编制测验的首要前提。确定测验目标是编制测验的首要前提。832 2、测验目标与教育目标

62、分类、测验目标与教育目标分类 测验目标的确定是以教育目标分类理论为基础的。测验目标的确定是以教育目标分类理论为基础的。测验目标的确定是以教育目标分类理论为基础的。测验目标的确定是以教育目标分类理论为基础的。(1 1 1 1)布鲁姆的认知目标领域)布鲁姆的认知目标领域)布鲁姆的认知目标领域)布鲁姆的认知目标领域 知识:这是最低等级的认知目标。主要指记忆知识。知识:这是最低等级的认知目标。主要指记忆知识。知识:这是最低等级的认知目标。主要指记忆知识。知识:这是最低等级的认知目标。主要指记忆知识。对学过的知识和有关材料的识别和再现。对学过的知识和有关材料的识别和再现。对学过的知识和有关材料的识别和再

63、现。对学过的知识和有关材料的识别和再现。 理解:这是最低层次的理解。主要是对知识的掌握,理解:这是最低层次的理解。主要是对知识的掌握,理解:这是最低层次的理解。主要是对知识的掌握,理解:这是最低层次的理解。主要是对知识的掌握,其特点是脱离了其特点是脱离了其特点是脱离了其特点是脱离了“死记硬背死记硬背死记硬背死记硬背”。 应用:指的是将学过的材料(知识)应用到新的具体应用:指的是将学过的材料(知识)应用到新的具体应用:指的是将学过的材料(知识)应用到新的具体应用:指的是将学过的材料(知识)应用到新的具体情景中去。情景中去。情景中去。情景中去。 分析:指能将知识进行分解,找出组成要素,并分析分析:

64、指能将知识进行分解,找出组成要素,并分析分析:指能将知识进行分解,找出组成要素,并分析分析:指能将知识进行分解,找出组成要素,并分析其相互关系及组成原理。其相互关系及组成原理。其相互关系及组成原理。其相互关系及组成原理。 综合:与分析相反,指把各个元素或部分组成新的整综合:与分析相反,指把各个元素或部分组成新的整综合:与分析相反,指把各个元素或部分组成新的整综合:与分析相反,指把各个元素或部分组成新的整体。体。体。体。 评价:指根据一定的标准对事物给予价值判断。评价:指根据一定的标准对事物给予价值判断。评价:指根据一定的标准对事物给予价值判断。评价:指根据一定的标准对事物给予价值判断。84布氏

65、上述六类目标是有层次、有顺序的,布氏上述六类目标是有层次、有顺序的,知识是最低层次,是最基本的要求。其知识是最低层次,是最基本的要求。其余依次是理解、应用、分析、综合、评余依次是理解、应用、分析、综合、评价。评价为认知领域的最高层次,是前价。评价为认知领域的最高层次,是前面五种目标的综合并增加了价值标准。面五种目标的综合并增加了价值标准。这六类目标,由简单到复杂,由低级到这六类目标,由简单到复杂,由低级到高级依次排列,组成层次结构。高级依次排列,组成层次结构。85(2 2)我国认知目标的分类)我国认知目标的分类A A A A、五分法、五分法、五分法、五分法知识知识知识知识理解理解理解理解应用应

66、用应用应用分析综合分析综合分析综合分析综合创造创造创造创造B B B B、四分法、四分法、四分法、四分法识记识记识记识记理解理解理解理解简单运用简单运用简单运用简单运用综合运用综合运用综合运用综合运用86(二)确定测验内容(二)确定测验内容测验内容的确定,实际上也就是内容抽样测验内容的确定,实际上也就是内容抽样的决定和测验目标的确立相结合而成。的决定和测验目标的确立相结合而成。这一结合过程必须通过命题双向细目表来这一结合过程必须通过命题双向细目表来确定。确定。命题双向细目表由命题双向细目表由3 3个要素构成:个要素构成:测验目标测验目标测验内容测验内容测验目标和测验内容的比例测验目标和测验内容

67、的比例87比例确定标准比例确定标准每一内容范围的比例应与该内容项目在整个教每一内容范围的比例应与该内容项目在整个教每一内容范围的比例应与该内容项目在整个教每一内容范围的比例应与该内容项目在整个教学领域里的相对重要性相符合,这种相对重要学领域里的相对重要性相符合,这种相对重要学领域里的相对重要性相符合,这种相对重要学领域里的相对重要性相符合,这种相对重要性可由该内容项目的教学课时的多少来体现;性可由该内容项目的教学课时的多少来体现;性可由该内容项目的教学课时的多少来体现;性可由该内容项目的教学课时的多少来体现;每一目标层次所要求的比例应当与测验编制者每一目标层次所要求的比例应当与测验编制者每一目

68、标层次所要求的比例应当与测验编制者每一目标层次所要求的比例应当与测验编制者认为这个目标对所受测学生的水平所具有的重认为这个目标对所受测学生的水平所具有的重认为这个目标对所受测学生的水平所具有的重认为这个目标对所受测学生的水平所具有的重要性相符。要性相符。要性相符。要性相符。测验双向细目表,是编制测验的蓝图,它详细测验双向细目表,是编制测验的蓝图,它详细测验双向细目表,是编制测验的蓝图,它详细测验双向细目表,是编制测验的蓝图,它详细说明了测验的内容、测验目标,对试题数量、说明了测验的内容、测验目标,对试题数量、说明了测验的内容、测验目标,对试题数量、说明了测验的内容、测验目标,对试题数量、考试时

69、间安排、测验分数分配等,都起着重要考试时间安排、测验分数分配等,都起着重要考试时间安排、测验分数分配等,都起着重要考试时间安排、测验分数分配等,都起着重要作用,因此,它是编制测验必不可少的一环。作用,因此,它是编制测验必不可少的一环。作用,因此,它是编制测验必不可少的一环。作用,因此,它是编制测验必不可少的一环。88测验材料的收集必须遵循的原则:测验材料的收集必须遵循的原则:1 1、测验材料要适合测验目的、测验材料要适合测验目的2 2、测验材料要能够代表该教材的全部内、测验材料要能够代表该教材的全部内容容3 3、测验材料要有普遍性、测验材料要有普遍性4 4、测验材料要适合学生程度并能鉴别学、测

70、验材料要适合学生程度并能鉴别学生的学习水平生的学习水平5 5、测验材料要能激发学生的进取心、测验材料要能激发学生的进取心89(三)测验设计(三)测验设计1 1 1 1、测验形式的确定、测验形式的确定、测验形式的确定、测验形式的确定2 2 2 2、测验题目形式的确定、测验题目形式的确定、测验题目形式的确定、测验题目形式的确定3 3 3 3、测验具体题型的确定与题目编制、测验具体题型的确定与题目编制、测验具体题型的确定与题目编制、测验具体题型的确定与题目编制4 4 4 4、测验题目量的确定、测验题目量的确定、测验题目量的确定、测验题目量的确定5 5 5 5、测验时间的确定、测验时间的确定、测验时间

71、的确定、测验时间的确定6 6 6 6、测验题目的编制、测验题目的编制、测验题目的编制、测验题目的编制先按试题的形式及内容分类先按试题的形式及内容分类先按试题的形式及内容分类先按试题的形式及内容分类从易到难排列从易到难排列从易到难排列从易到难排列90二、测验题目编制技术二、测验题目编制技术1 1 1 1、客观性测验题目的编制(约占、客观性测验题目的编制(约占、客观性测验题目的编制(约占、客观性测验题目的编制(约占60%60%60%60%左右)左右)左右)左右)试题应反映教学内容的重点或教学过程中要求试题应反映教学内容的重点或教学过程中要求试题应反映教学内容的重点或教学过程中要求试题应反映教学内容

72、的重点或教学过程中要求学生掌握的有意义的内容和知识点;学生掌握的有意义的内容和知识点;学生掌握的有意义的内容和知识点;学生掌握的有意义的内容和知识点;务必使每道试题自成一体,不可互相牵扯;务必使每道试题自成一体,不可互相牵扯;务必使每道试题自成一体,不可互相牵扯;务必使每道试题自成一体,不可互相牵扯;试题文字力求浅显易懂,题意明确;试题文字力求浅显易懂,题意明确;试题文字力求浅显易懂,题意明确;试题文字力求浅显易懂,题意明确;试题的答案应该是明确且唯一的;试题的答案应该是明确且唯一的;试题的答案应该是明确且唯一的;试题的答案应该是明确且唯一的;试题应按教育目标的要求,内容不能超过受测试题应按教

73、育目标的要求,内容不能超过受测试题应按教育目标的要求,内容不能超过受测试题应按教育目标的要求,内容不能超过受测者的知识和能力。者的知识和能力。者的知识和能力。者的知识和能力。912 2、主观性测验题目的编制(大约占、主观性测验题目的编制(大约占40%40%左右)左右)试题应考查教育内容中的重要问题;试题应考查教育内容中的重要问题;把问题和实际情景结合起来,强调知识把问题和实际情景结合起来,强调知识的应用;的应用;要给被试发挥自己创造力的余地;要给被试发挥自己创造力的余地;要使答案的复杂程度与被试的成熟程度要使答案的复杂程度与被试的成熟程度相符。相符。92三、教育测量分数的整理和分析三、教育测量

74、分数的整理和分析编制频数分布表编制频数分布表求组中值求组中值求全矩求全矩求组数求组数求组限求组限画频数分布曲线图画频数分布曲线图93分析频数曲线图分析频数曲线图1 1、常态分布、常态分布即成绩中等的多,优秀和差的少,俗称即成绩中等的多,优秀和差的少,俗称“中间大,两头小中间大,两头小”。学生的学业成绩。学生的学业成绩呈常态分布,表明能正确、客观地反映呈常态分布,表明能正确、客观地反映学生真实的知识程度和能力水平。这是学生真实的知识程度和能力水平。这是因为学生智力及其差异,一般是呈常态因为学生智力及其差异,一般是呈常态分配的;另外,教学大纲的制定、教材分配的;另外,教学大纲的制定、教材的编写、考

75、试命题都是从大多数中等程的编写、考试命题都是从大多数中等程度学生的实际出发,为大多数中等水平度学生的实际出发,为大多数中等水平的学生经过努力能接受的。的学生经过努力能接受的。942 2、正偏态分布、正偏态分布即低分人数很多,高分人数很少。学生的学即低分人数很多,高分人数很少。学生的学业成绩呈正偏态分布,表明测试难度过大,业成绩呈正偏态分布,表明测试难度过大,考试要求过高,超越大纲和教材的要求;或考试要求过高,超越大纲和教材的要求;或者学生的基础差,应调整试题的难度或教学者学生的基础差,应调整试题的难度或教学进度。进度。3 3、负偏态分布、负偏态分布即高分人数很多,低分人数很少。学生的学即高分人

76、数很多,低分人数很少。学生的学业成绩呈负偏态分布,表明测试较易,考试业成绩呈负偏态分布,表明测试较易,考试要求低于大纲或教材要求;或学生的基础好,要求低于大纲或教材要求;或学生的基础好,应加大试题的难度和教学的进度。应加大试题的难度和教学的进度。954 4 4 4、驼峰型分布、驼峰型分布、驼峰型分布、驼峰型分布即低分高分人数很多,中分人数很少。学生的即低分高分人数很多,中分人数很少。学生的即低分高分人数很多,中分人数很少。学生的即低分高分人数很多,中分人数很少。学生的学业成绩呈驼峰型分布,表明试题难度过大和学业成绩呈驼峰型分布,表明试题难度过大和学业成绩呈驼峰型分布,表明试题难度过大和学业成绩

77、呈驼峰型分布,表明试题难度过大和过小的题较多,中等难度的太少;或表明学生过小的题较多,中等难度的太少;或表明学生过小的题较多,中等难度的太少;或表明学生过小的题较多,中等难度的太少;或表明学生基础相差悬殊,好的和差的学生多,中等程度基础相差悬殊,好的和差的学生多,中等程度基础相差悬殊,好的和差的学生多,中等程度基础相差悬殊,好的和差的学生多,中等程度的学生较少。的学生较少。的学生较少。的学生较少。5 5 5 5、平波型分布、平波型分布、平波型分布、平波型分布即中低高分人数差不多。学生的学业成绩呈平即中低高分人数差不多。学生的学业成绩呈平即中低高分人数差不多。学生的学业成绩呈平即中低高分人数差不

78、多。学生的学业成绩呈平波型分布,表明大中小几种难度的试题比较接波型分布,表明大中小几种难度的试题比较接波型分布,表明大中小几种难度的试题比较接波型分布,表明大中小几种难度的试题比较接近,或学生的基础相差不大,试题区分度低,近,或学生的基础相差不大,试题区分度低,近,或学生的基础相差不大,试题区分度低,近,或学生的基础相差不大,试题区分度低,需要提高区分度。需要提高区分度。需要提高区分度。需要提高区分度。966 6、陡峭型分布、陡峭型分布即中分人数很多,低高分人数极少。学即中分人数很多,低高分人数极少。学生的学业成绩呈陡峭型分布,表明难度生的学业成绩呈陡峭型分布,表明难度中等的试题比例过大,缺乏

79、区分度或学中等的试题比例过大,缺乏区分度或学生的基础相差不大,要提高试题的区分生的基础相差不大,要提高试题的区分度。度。97学生的成绩分布曲线的形态多种多样,学生的成绩分布曲线的形态多种多样,是教学过程中多种现象的反映,这些现是教学过程中多种现象的反映,这些现象都是通过原因与结果的连续和交织形象都是通过原因与结果的连续和交织形成的。造成这种现象的原因是复杂的,成的。造成这种现象的原因是复杂的,往往与教师的教学态度、教学水平、教往往与教师的教学态度、教学水平、教学经验有关,与学生的学习态度、学习学经验有关,与学生的学习态度、学习基础、学习方法、学习习惯有关,与学基础、学习方法、学习习惯有关,与学

80、校的思想政治工作和行政管理工作质量校的思想政治工作和行政管理工作质量有关,与社会因素和家庭教育有关。有关,与社会因素和家庭教育有关。98逐题分析法逐题分析法就是对试卷中每一道题的得分和失分情就是对试卷中每一道题的得分和失分情况进行分析,将每题的高分率(指该题况进行分析,将每题的高分率(指该题高于应得分数的高于应得分数的90%90%的人数的百分比)、的人数的百分比)、及格率、不及格率和零分率统计出来,及格率、不及格率和零分率统计出来,以便分析学生对每道试题的掌握情况和以便分析学生对每道试题的掌握情况和存在问题。存在问题。99第十一章第十一章 教育评价的方法教育评价的方法教育评价方法是指收集、整理

81、、优化信息资料教育评价方法是指收集、整理、优化信息资料教育评价方法是指收集、整理、优化信息资料教育评价方法是指收集、整理、优化信息资料的手段和技术。它是为达到评价目标,根据评的手段和技术。它是为达到评价目标,根据评的手段和技术。它是为达到评价目标,根据评的手段和技术。它是为达到评价目标,根据评价的原则选定的有利于各种评价力量协同工作价的原则选定的有利于各种评价力量协同工作价的原则选定的有利于各种评价力量协同工作价的原则选定的有利于各种评价力量协同工作的一整套活动方式。的一整套活动方式。的一整套活动方式。的一整套活动方式。一、定性分析方法一、定性分析方法一、定性分析方法一、定性分析方法是用语言描

82、述形式以及哲学思辨、逻辑分析揭是用语言描述形式以及哲学思辨、逻辑分析揭是用语言描述形式以及哲学思辨、逻辑分析揭是用语言描述形式以及哲学思辨、逻辑分析揭示被评价对象特征的信息收集分析、处理的方示被评价对象特征的信息收集分析、处理的方示被评价对象特征的信息收集分析、处理的方示被评价对象特征的信息收集分析、处理的方法。如:观察法、综合分析法、访谈法、归纳法。如:观察法、综合分析法、访谈法、归纳法。如:观察法、综合分析法、访谈法、归纳法。如:观察法、综合分析法、访谈法、归纳法等。法等。法等。法等。100定性分析法在教育评价中的作用定性分析法在教育评价中的作用为定量分析活动提供基础为定量分析活动提供基础

83、为定量分析结果提供说明为定量分析结果提供说明为被评人员改进工作提供指南为被评人员改进工作提供指南1011 1、观察法、观察法是一种简单易行的方法。它是评价者根据评价是一种简单易行的方法。它是评价者根据评价是一种简单易行的方法。它是评价者根据评价是一种简单易行的方法。它是评价者根据评价对象和指标内涵的要求,有目的有计划地直接对象和指标内涵的要求,有目的有计划地直接对象和指标内涵的要求,有目的有计划地直接对象和指标内涵的要求,有目的有计划地直接进行自然状态或控制条件下观察并获取信息资进行自然状态或控制条件下观察并获取信息资进行自然状态或控制条件下观察并获取信息资进行自然状态或控制条件下观察并获取信

84、息资料的过程。料的过程。料的过程。料的过程。观察法适用于各种评价,主要是以观察法适用于各种评价,主要是以观察法适用于各种评价,主要是以观察法适用于各种评价,主要是以“听听听听”和和和和“看看看看”为基本手段。为基本手段。为基本手段。为基本手段。运用观察法的要求:运用观察法的要求:运用观察法的要求:运用观察法的要求:有针对性有针对性有针对性有针对性有很强的洞察力,能有很强的洞察力,能有很强的洞察力,能有很强的洞察力,能“眼观六路,耳听八方眼观六路,耳听八方眼观六路,耳听八方眼观六路,耳听八方”,透过现象看本质,透过现象看本质,透过现象看本质,透过现象看本质作好即时现场记录作好即时现场记录作好即时

85、现场记录作好即时现场记录102以教师课堂教学评价的观察为例根据评价目的和质量要求,设计好听课记录表根据评价目的和质量要求,设计好听课记录表格;格;根据调查活动的时间安排和参与评价人员的业根据调查活动的时间安排和参与评价人员的业务素质确定听课人员,听课人员一般应由懂得务素质确定听课人员,听课人员一般应由懂得此门学科的人员或专业人员参加;此门学科的人员或专业人员参加;听课人员进入课堂听课,并根据授课人的教态、听课人员进入课堂听课,并根据授课人的教态、学生的反应等情况,及时作好记录,或填写好学生的反应等情况,及时作好记录,或填写好听课记录表;听课记录表;将听课记录表收集起来进行统计处理,对授课将听课

86、记录表收集起来进行统计处理,对授课人的水平作出综合分析结论。人的水平作出综合分析结论。1032、逻辑分析法 逻辑分析的方法是教育评价中运用最多,也是最重要逻辑分析的方法是教育评价中运用最多,也是最重要的手段之一。这不仅是因为搜集的评价资料中存在着的手段之一。这不仅是因为搜集的评价资料中存在着大量的非数量化的材料,难于进行统计分析,而且即大量的非数量化的材料,难于进行统计分析,而且即使进行统计分析,其结论的解释、说明等也需要借助使进行统计分析,其结论的解释、说明等也需要借助逻辑分析的方法作更深层的分析研究。逻辑分析的方法作更深层的分析研究。 逻辑分析的方法是运用辩正唯物主义的哲学观,透过逻辑分析

87、的方法是运用辩正唯物主义的哲学观,透过事物的现象认识并揭示其本质,从事物的外部联系深事物的现象认识并揭示其本质,从事物的外部联系深入到内部联系,从偶然事件中发现必然规律,并从整入到内部联系,从偶然事件中发现必然规律,并从整体把握事实真相的方法。体把握事实真相的方法。 其具体的方法有:分析与综合、抽象与概括、分类与其具体的方法有:分析与综合、抽象与概括、分类与比较、归纳与演绎、具体化与系统化等。比较、归纳与演绎、具体化与系统化等。104二、定量分析法是指用数值形式以及数学、统计方法反映被评价对象特征的信息分析、处理的方法。如:算术平均值法、矩阵法、权数分配法、推断统计法。定量分析法在教育评价中的

88、作用数量分析是获得评价结论的重要依据定量分析是表述评价结论最简洁的方法105定量分析的具体方法1、算术平均值法2、加权平均值法3、矩阵法4、权数分配法5、推断统计法106三、设计教育评价指标体系的方法(一)目标与指标(一)目标与指标1 1、目标、目标目标即目的,泛指人们从事活动所达到的目的。目标即目的,泛指人们从事活动所达到的目的。2 2、指标、指标指综合反映某种社会现象状况的一些数字,把指综合反映某种社会现象状况的一些数字,把这些数字与反映对象某一方面的因素结合起来,这些数字与反映对象某一方面的因素结合起来,就构成了指标。就构成了指标。简单地说,指标就是目标一个方面的规定,它简单地说,指标就

89、是目标一个方面的规定,它是具体的、可测量的、行为化和操作化的目标。是具体的、可测量的、行为化和操作化的目标。1073、指标体系任何一指标都不反映全部的目标,它只反映目标的一个方面。或者说,它只反映目标的一个局部,只有系统化的,具有紧密联系的一群指标,才反映全部的目标,称之为指标体系。目标与指标有和联系与区别?108 联系:联系: (1 1)目标是指标的根据和基础;)目标是指标的根据和基础; (2 2)指标是目标的具体化和操作化,是操作化了的目)指标是目标的具体化和操作化,是操作化了的目标;标; (3 3)指标反映目标,并通过实践活动积极影响目标的)指标反映目标,并通过实践活动积极影响目标的变化

90、。变化。 区别:区别: (1 1)目标反映对象的全貌,指标反映对象的局部特征;)目标反映对象的全貌,指标反映对象的局部特征;(2 2)目标内涵较宽,比较抽象,比较笼统;指标内涵)目标内涵较宽,比较抽象,比较笼统;指标内涵较窄,比较具体,比较清晰;较窄,比较具体,比较清晰; (3 3)目标相对于指标来说比较稳定,一经确定变动较)目标相对于指标来说比较稳定,一经确定变动较少,指标对于目标来说比较灵活,可根据一个时期的少,指标对于目标来说比较灵活,可根据一个时期的侧重点进行调整。侧重点进行调整。109(二)指标体系的结构1 1、直线式结构、直线式结构 二级指标二级指标1111一级指标一级指标1 1

91、二级指标二级指标1212 二级指标二级指标2121一级指标一级指标2 2 二级指标二级指标2222 二级指标二级指标3131一级指标一级指标3 3 二级指标二级指标3232110例1:小学生最优发展的整体评价指标体系 思想品德思想品德 思想素质思想素质 科学素质科学素质 性格性格 情趣爱好情趣爱好 小小 审美素质审美素质 美的感受和鉴赏美的感受和鉴赏 学学 美的表达和创造美的表达和创造 生生 学业成绩学业成绩 最最 知识素质知识素质 知识结构知识结构 优优 百科知识面百科知识面 发发 自学能力自学能力 展展 能力素质能力素质 自理生活能力自理生活能力 人际交往和组织能力人际交往和组织能力 体态

92、和机能体态和机能 身体素质身体素质 运动能力运动能力 卫生保健卫生保健1112、树状式结构一级指标一级指标一级指标总目标二级指标112例2:学生主体性的基本结构主体性自主性主动性创造性自尊自信自我调控独立判断决断自觉自理成就动机竞争意识兴趣和求知欲主动参与社会适应性创新意识创造性思维能力动手实践能力113(三)教育评价指标体系建立的步骤和方法1、步骤:(1)分解目标,提出初拟指标(2)归类合并,进行筛选(3)理论论证(4)专家评判(5)预试修订114(1)分解目标,提出初拟指标一般较为注意指标的科学性、完备性,唯恐挂一漏了或包罗不尽。这些指标不仅是较为粗疏的,数量也可能是比较多的。115(2)

93、归类合并,进行筛选在初拟指标中,有的能反映评价对象的本质,有的则未必;有的算得上主要因素,有的可能只是次要因素。各因素之间出现交叉、重复、包含、矛盾、因果等关系,也难以避免,必须对初拟指标进行归类合并和筛选,以达到“少而精”的要求。116(3)理论论证经过以上方法筛选所得的指标,是否符合评价经过以上方法筛选所得的指标,是否符合评价要求,还必须从有关学科的科学意义上进行理要求,还必须从有关学科的科学意义上进行理论论证,论证的主要依据是教育科学、心理学论论证,论证的主要依据是教育科学、心理学和系统科学。和系统科学。论证时,在明确指标内涵的基础上,针对教育论证时,在明确指标内涵的基础上,针对教育目标

94、、评价目标、和被评价对象的实际情况逐目标、评价目标、和被评价对象的实际情况逐一进行论证,以求高质量的指标体系。一进行论证,以求高质量的指标体系。从整体上讲,指标体系要求层次清楚而不零乱,从整体上讲,指标体系要求层次清楚而不零乱,结构严谨而不松散,对每一条指标,要求内涵结构严谨而不松散,对每一条指标,要求内涵明确而不含糊,表述简洁而不累赘。明确而不含糊,表述简洁而不累赘。117指标表述的标准 能被理解的:用不含糊、清楚的语言表述。能被理解的:用不含糊、清楚的语言表述。 行为导向的:说明预期的行为。行为导向的:说明预期的行为。 可以度量的:可以直接测量的。可以度量的:可以直接测量的。 能被运用的:

95、用可操作的语言下定义的。能被运用的:用可操作的语言下定义的。 意义深远的:能引发高级行为效果。意义深远的:能引发高级行为效果。 实际的:在现有的资源、时间、才能和可用技术下能完成的。实际的:在现有的资源、时间、才能和可用技术下能完成的。 重要的:说明重要的和相关的效果。重要的:说明重要的和相关的效果。 发展的:随时间演进,在不同角度继续成长。发展的:随时间演进,在不同角度继续成长。 综合的:包括一切重要效果。综合的:包括一切重要效果。 均衡的:制定多种目标的优先顺序。均衡的:制定多种目标的优先顺序。 正确的:表示出组织者的真正意图。正确的:表示出组织者的真正意图。 扼要的:用以表达的文字越少越

96、好。扼要的:用以表达的文字越少越好。 这些标准,供我们表述指标时参考。这些标准,供我们表述指标时参考。118(4)专家评判这是指标设计从设计者手中走向管理实践的重要步骤。专家通常包括评价理论研究者、上级领导、富有经验的教育行政干部、教师等。专家评判可采用个别访问、座谈、问卷征询、现场调查等方式,应根据不同情况选择。119(5)预试修订指标体系经过筛选、修订,初步确定以后,可以同评定标准相匹配,选点在小范围试验,看是否可行,试验后对指标体系再作修改,然后投入使用。1202、方法 (1 1)头脑风暴法)头脑风暴法 是利用头脑积极思维,进行智力碰撞,激发智慧的灵是利用头脑积极思维,进行智力碰撞,激发

97、智慧的灵感,从而提出评价指标的一种常用方法。感,从而提出评价指标的一种常用方法。 (2 2)因素分解法)因素分解法 是一种将评价指标按照评价对象本身的逻辑结构逐级是一种将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方进行分解,把分解出来的主要因素作为评价指标的方法。法。 应当注意:分解出来的因素,从高到低逐层缩小内涵,应当注意:分解出来的因素,从高到低逐层缩小内涵,越往下层次指标越明确、越具体、范围越小,越可以越往下层次指标越明确、越具体、范围越小,越可以观测。观测。 (3 3)理论推演法)理论推演法 是根据有关学科的理论推演出评价指标的方法。是根据有关学

98、科的理论推演出评价指标的方法。 (4 4)典型研究法)典型研究法 是通过少数典型事例进行研究而设计评价指标的方法。是通过少数典型事例进行研究而设计评价指标的方法。1213、筛选指标的方法 (1 1)经验法)经验法 是凭设计者的学识修养和工作经验进行筛选的一种简便实用的方是凭设计者的学识修养和工作经验进行筛选的一种简便实用的方法。法。 一般遵循以下几个要点:一般遵循以下几个要点: A A、理由是否充分或必要、理由是否充分或必要 判断每项指标是否是必要的,缺了它有什么不好,保留它有什么判断每项指标是否是必要的,缺了它有什么不好,保留它有什么理由,被保留的要有充分的依据,在指标体系中,属于非要不可理

99、由,被保留的要有充分的依据,在指标体系中,属于非要不可的因素。的因素。 B B、取主舍次、取主舍次 区分每项指标反映评价对象本质的程度,保留能反映本质的主要区分每项指标反映评价对象本质的程度,保留能反映本质的主要因素,舍弃不能充分反映本质的次要因素。因素,舍弃不能充分反映本质的次要因素。 C C、从各指标之间的关系上进行比较、从各指标之间的关系上进行比较 内涵相同或近似的合并,内涵交叉的保留其一;有因果关系的,内涵相同或近似的合并,内涵交叉的保留其一;有因果关系的,保留保留“因因”而去掉而去掉“果果”;相互矛盾的保留既符合方针、政策规;相互矛盾的保留既符合方针、政策规定又切合当地实际的指标。定

100、又切合当地实际的指标。 D D、去难存易,删繁就简、去难存易,删繁就简 确实难测的指标可以舍弃;指标内涵复杂的,尽量求其单一。确实难测的指标可以舍弃;指标内涵复杂的,尽量求其单一。122(2)调查统计法是在调查获取资料的基础上进行统计的方法。是在调查获取资料的基础上进行统计的方法。其具体的做法是:把初拟指标制成问卷,发给其具体的做法是:把初拟指标制成问卷,发给有关专家和有经验的教育工作者,请他们对初有关专家和有经验的教育工作者,请他们对初拟指标每一项作出判断。拟指标每一项作出判断。一般分为五档,即很重要、重要、一般、可要一般分为五档,即很重要、重要、一般、可要可不要、不要。答卷者在每项指标后记

101、上自己可不要、不要。答卷者在每项指标后记上自己判断该项指标相比之下的重要程度(只能定一判断该项指标相比之下的重要程度(只能定一个档次),然后,收回问卷,统计个档次),然后,收回问卷,统计“很重要很重要”、“重要重要”两档的人数比例,按评为两档的人数比例,按评为“很重要很重要”、“重要重要”人数比例由高到低顺序排列,把人数比例由高到低顺序排列,把低于某数值(一般低于三分之二或四分之三处低于某数值(一般低于三分之二或四分之三处作为划界)的指标删除,就得到筛选的指标。作为划界)的指标删除,就得到筛选的指标。123例3:学校领导班子评价指标体系的建立1 1、首先分、首先分4 4个层次提出了个层次提出了

102、1616项指标项指标(1 1)政治素质(政治理论和政策水平、思想)政治素质(政治理论和政策水平、思想品德修养、事业心和责任感)品德修养、事业心和责任感)(2 2)业务素质(文化专业达标、教育理论修)业务素质(文化专业达标、教育理论修养、管理实践经验)养、管理实践经验)(3 3)工作效能(职务与能力相称、分工明确)工作效能(职务与能力相称、分工明确和各尽其责、团结协作、指挥灵便、工作效率和各尽其责、团结协作、指挥灵便、工作效率高)高)(4 4)工作作风(深入实际、发扬民主、决策)工作作风(深入实际、发扬民主、决策果断、以身作则、开拓精神)果断、以身作则、开拓精神)1242 2、把以上、把以上16

103、16项指标,分为五档(很重要、重项指标,分为五档(很重要、重要、一般、可要可不要、不要),分别征询意要、一般、可要可不要、不要),分别征询意见,获得以下结果:见,获得以下结果:政治素质(事业心和责任感政治素质(事业心和责任感1 1、政治理论和政、政治理论和政策水平策水平3 3、思想品德修养、思想品德修养1111)业务素质(教育理论修养业务素质(教育理论修养2 2、管理实践经验、管理实践经验1010)工作效能(团结协作工作效能(团结协作5 5、分工明确和各尽其责、分工明确和各尽其责8 8、工作效率高、工作效率高9 9)工作作风(决策果断工作作风(决策果断4 4、以身作则、以身作则6 6、开拓精神

104、、开拓精神7 7、发扬民主、发扬民主1212)125第五章 教育评价心理及其调控一、评价心理的概念所谓评价心理,是指参评者对评价现实的体验或反映。参评者:不仅包括主评者或主评团体,还包括被评者或被评团体。评价现实:是指评价过程的实践活动和评价过程的各种关系交往等现实活动。126提问:评价心理=心理评价?心理评价:是指评价者对心理现象的价值判断。心理评价:是指评价者对心理现象的价值判断。1 1、二者研究对象所在的范畴不同、二者研究对象所在的范畴不同评价心理旨在研究有关评价活动中主评者或主评价心理旨在研究有关评价活动中主评者或主评团体、被评者或被评团体以及评价过程中的评团体、被评者或被评团体以及评

105、价过程中的各种心理的变化的影响。它的研究对象归根到各种心理的变化的影响。它的研究对象归根到底是心理学上的问题。底是心理学上的问题。心理评价旨在对人的各种心理活动进行价值认心理评价旨在对人的各种心理活动进行价值认识和价值判断。它的研究对象归根结底不是心识和价值判断。它的研究对象归根结底不是心理问题,而是价值论问题。理问题,而是价值论问题。1272、二者的实际功用不同评价心理的研究是为了能够控制评价活动中参评人员的态度、情感和意志等心理因素的影响,调节人的主观心态,从而保证评价尽可能地公正、客观。心理评价是为了区分各种心理品质的优劣,以引导人们克服自卑、妒忌和偏见等不良心理品质,培养健康的、积极向

106、上的心理品质。128提问:为什么人的主观状态、心理因素会影响评价的客观性?为什么不能“铁面无私”、“秉公执法”呢? 评价是依据一定目标对评价对象进行的价值判断的活评价是依据一定目标对评价对象进行的价值判断的活动。动。 这一价值判断是建立在个人对客体的感性认识基础之这一价值判断是建立在个人对客体的感性认识基础之上的价值判断,主要取决于主体的情感和意志,决定上的价值判断,主要取决于主体的情感和意志,决定于主体对它们的态度。于主体对它们的态度。 这朵花是白的这朵花是白的这是一个这是一个事实判断。事实判断。 如如2 2个命题个命题 这朵花是美的这朵花是美的这是一个这是一个价值判断。价值判断。 可见,评

107、价活动是一种主体性很强的活动,评价中必可见,评价活动是一种主体性很强的活动,评价中必然有主体的态度、情感、意志等心理因素的参与,所然有主体的态度、情感、意志等心理因素的参与,所以,那种绝对意义上、理想的以,那种绝对意义上、理想的“铁面无私铁面无私”、“秉公秉公执法执法”、“绝对客观绝对客观”不可能产生。不可能产生。129二、评价心理的调控评价心理调控:是指用一定的手段和方法,对评价心理调控:是指用一定的手段和方法,对评价者和被评价者可能出现的心理行为进行调评价者和被评价者可能出现的心理行为进行调节、控制和利用,使评价工作顺利开展。节、控制和利用,使评价工作顺利开展。(一)调控评价心理的意义(一

108、)调控评价心理的意义1 1、通过心理调控,可以使教育评价的准备更、通过心理调控,可以使教育评价的准备更加合理充分加合理充分2 2、通过心理调控,可以保证教育评价活动的、通过心理调控,可以保证教育评价活动的实施得以顺利进行,更好地完成各环节的任务实施得以顺利进行,更好地完成各环节的任务3 3、通过心理调控,可以使评价的功能得以全、通过心理调控,可以使评价的功能得以全面发挥,圆满实现评价的目的面发挥,圆满实现评价的目的130(二)评价者心理与调控1 1、评价者的心理现象、评价者的心理现象(1 1)准备过程的心理现象(角色心理、心理)准备过程的心理现象(角色心理、心理定势、新奇感、时尚效应和期望效应

109、)定势、新奇感、时尚效应和期望效应)(2 2)施评过程的心理现象(自尊心理、首因)施评过程的心理现象(自尊心理、首因效应、近因效应、晕轮效应、参照效应、理想效应、近因效应、晕轮效应、参照效应、理想效应、时序效应、成见效应、宽大效应和附和效应、时序效应、成见效应、宽大效应和附和权威心理)权威心理)(3 3)结果处理过程的心理现象(类群效应、)结果处理过程的心理现象(类群效应、从众心理、逆反心理、本位心理和模式效应)从众心理、逆反心理、本位心理和模式效应)1312、评价者心理的调控(1)评价者素质能力的调控把好选拔关评价技能培训思想品德教育(2)管理上的调控(3)通过心理“换位”使评价者自觉进行调

110、控(4)通过完善规章制度加以调控132三、被评价者心理与调控1、被评价者的心理现象(1)被评价者自我评价心理现象(自我认可疑惧心理和被审心理)(2)受评过程心理现象(应付心理、迎合心理和自卫心理)(3)结果反馈心理现象(敏感心理、护短心理、嫉妒心理和对评价进行评价心理)1332、自我评价的心理机制自我评价不但是评价过程的必要环节,而且自我评价对评价结果有着相当大的影响,需要了解被评价者自我评价形成的心理机制。(1)根据别人对自己的评价来评价自己(2)通过与他人的对比来评价自己(3)通过自我分析来实现自我评价1343、被评价者心理的调控 (1 1)提高对评价的认识)提高对评价的认识 搞好评价动员

111、搞好评价动员 征求群众对评价方案的意见,采纳合理的建议,打破评价的神秘征求群众对评价方案的意见,采纳合理的建议,打破评价的神秘感感 讲明评价的计划和日程安排,使被评价者心中有数讲明评价的计划和日程安排,使被评价者心中有数 建立和健全评价制度建立和健全评价制度 被评价单位的领导和骨干要为群众作出榜样,以正确的态度积极被评价单位的领导和骨干要为群众作出榜样,以正确的态度积极投入评价工作投入评价工作 (2 2)采用多种评价形态,控制评价效应(如:转移法、暗示法、)采用多种评价形态,控制评价效应(如:转移法、暗示法、深呼吸法等)深呼吸法等) (3 3)保持评价者和被评价者良好的心理交往状态)保持评价者

112、和被评价者良好的心理交往状态 (4 4)适当进行自我评价)适当进行自我评价 正确对待别人对自己的评价正确对待别人对自己的评价 把握自己与别人类比的可比性把握自己与别人类比的可比性 对自己的评价要全面对自己的评价要全面 学会把别人的评价、与别人的类比、自我评价统一起来学会把别人的评价、与别人的类比、自我评价统一起来 (5 5)结果反馈方式要灵活多样)结果反馈方式要灵活多样135被评价者4种心理状态1 1、评价者情绪好与被评价者情绪好相结合、评价者情绪好与被评价者情绪好相结合2 2、评价者情绪好,被评价者情绪不好、评价者情绪好,被评价者情绪不好3 3、评价者情绪不好,被评价者情绪好、评价者情绪不好

113、,被评价者情绪好4 4、评价者与被评价者情绪不好、评价者与被评价者情绪不好可见,不论在什么情况下,评价者的情绪和态可见,不论在什么情况下,评价者的情绪和态度是至关重要的。有素养的评价者,应该始终度是至关重要的。有素养的评价者,应该始终保持良好的情绪,使双方心理交流处于良好状保持良好的情绪,使双方心理交流处于良好状态。这样才有可能采取主动,对被评价者的心态。这样才有可能采取主动,对被评价者的心理实施调控,使评价工作得以顺利进行。理实施调控,使评价工作得以顺利进行。136第六章 学校办学水平的评价一、学校办学水平评价的作用1、有利于端正办学方向,具有导向作用2、能够测度学校管理水平的高低,具有优化

114、管理的作用3、能反映学校各方面工作的优劣,具有激励、督促的作用4、有利于教育科学理论的研究与提高,起到探索规律、完善理论的作用137二、学校办学水平评价的基本内容和指标体系(一)学校办学水平的基本内容1、学校办学方向的评价这一方面主要是指对学校工作目标实现程度的评价。其评价的主要指标有:贯彻教育方针政策的情况执行教育法规的情况本校具体教育目标和管理目标的制订情况1382、学校办学条件的评价(1)学校中人力资源条件主要包括教师队伍和学校领导班子(2)学校中财力资源条件主要为学校的教育经费、钱财的收和支(3)学校中物力资源条件主要为学校建筑和学校设备1393、学校管理工作评价学校领导管理人员个体素

115、质及其队伍建设学校各项工作管理水平主要是学校德育、智育、体育、美育和劳动技术教育等各育以及学校教学、科研、教务、总务、课外活动等多项工作的管理程度1404、学校办学效果的评价学生质量的评价办学特色的评价社会与家庭对学校教育质量的评价141学校办学水平的评价模式 (一)社会需要的调查和目标决策评价(一)社会需要的调查和目标决策评价 社会需要调查的任务是研究这一地区特定的经济、文社会需要调查的任务是研究这一地区特定的经济、文化发展对学校的特殊需要;化发展对学校的特殊需要; 目标决策评价的任务是研究学校确定的培养目标是否目标决策评价的任务是研究学校确定的培养目标是否符合社会特定的需要。(核心是社会需

116、要的调查,在符合社会特定的需要。(核心是社会需要的调查,在此基础上确定培养目标的适当性)此基础上确定培养目标的适当性) 在这一阶段,评价者关心的主要问题是:在这一阶段,评价者关心的主要问题是: 学校主要培养什么人才,培养目标是什么,有何具体学校主要培养什么人才,培养目标是什么,有何具体要求,是否体现了以德育为首的全面发展的思想;要求,是否体现了以德育为首的全面发展的思想; 社会经济文化发展对毕业生有何要求,学校的发展规社会经济文化发展对毕业生有何要求,学校的发展规划、专业设置是否满足了社会对学校的实际需要,在划、专业设置是否满足了社会对学校的实际需要,在满足社会需要中学校有何措施和设想满足社会

117、需要中学校有何措施和设想142(二)办学条件的评价办学条件的评价的核心是判断培养目标实现的办学条件的评价的核心是判断培养目标实现的潜在可能性,或者说是判断学校的有关物质条潜在可能性,或者说是判断学校的有关物质条件是否能充分保证培养目标的实现。(核心是件是否能充分保证培养目标的实现。(核心是审查培养目标实现的潜在可能性)审查培养目标实现的潜在可能性)在这一阶段,评价者关心的问题是:在这一阶段,评价者关心的问题是:学生是否有一个良好的学习、生活环境;学生是否有一个良好的学习、生活环境;有关设施、设备能否满足教学和科研的需要,有关设施、设备能否满足教学和科研的需要,使用的情况如何;使用的情况如何;学

118、校教育经费能否基本满足需要,使用情况如学校教育经费能否基本满足需要,使用情况如何;何;能否有一支胜任工作的教师队伍。能否有一支胜任工作的教师队伍。143(三)办学过程的评价 办学过程评价的核心是调查教学教育过程和管理过程状况,判断办学过程评价的核心是调查教学教育过程和管理过程状况,判断学校在实现教育目标,解决各种问题,克服各种障碍方面作了哪学校在实现教育目标,解决各种问题,克服各种障碍方面作了哪些努力。(核心是调查学校教育管理过程和教学教育过程存在的些努力。(核心是调查学校教育管理过程和教学教育过程存在的问题)问题) 在这一阶段,评价者关心的问题是:在这一阶段,评价者关心的问题是: 学校党政领

119、导班子个体素质和群体结构如何;学校党政领导班子个体素质和群体结构如何; 学习哦啊师资队伍、政工队伍和管理干部队伍建设得如何;学习哦啊师资队伍、政工队伍和管理干部队伍建设得如何; 学校政治思想工作是否坚强有力,学生学习的积极性、教职员工学校政治思想工作是否坚强有力,学生学习的积极性、教职员工教学科研的积极性是否得到充分的调动,教书育人、管理育人、教学科研的积极性是否得到充分的调动,教书育人、管理育人、服务育人风气如何;服务育人风气如何; 学习哦啊在教学管理和改革上有否得力的措施,这些措施是否有学习哦啊在教学管理和改革上有否得力的措施,这些措施是否有效地促进了教学质量的提高和教学改革的深化;效地促

120、进了教学质量的提高和教学改革的深化; 学校科研工作管理如何,有否明显的社会效益与经济效益;学校科研工作管理如何,有否明显的社会效益与经济效益; 学校日常行政管理工作着量如何,群众团体的作用发挥得如何,学校日常行政管理工作着量如何,群众团体的作用发挥得如何,各项规章制度是否健全,是否得到了有力的贯彻等等。各项规章制度是否健全,是否得到了有力的贯彻等等。144(四)办学质量的评价与用人单位的跟踪调查 这是对办学水平的综合调查与评价。(核心是对教育这是对办学水平的综合调查与评价。(核心是对教育效果作出全面判断。)效果作出全面判断。) 在这一阶段,评价者关心的问题是:在这一阶段,评价者关心的问题是:

121、学生的思想品质是否得到了切实的提高;学生的思想品质是否得到了切实的提高; 学生的知识与能力是否达到了预期的目标;学生的知识与能力是否达到了预期的目标; 学生的身体素质能否胜任未来工作的需要;学生的身体素质能否胜任未来工作的需要; 用人单位对本校各届毕业生的评价如何;用人单位对本校各届毕业生的评价如何; 学校在科研上有何重大成果,社会效益如何;学校在科研上有何重大成果,社会效益如何; 学校对办学效益是否重视,近年来有否明显的提高。学校对办学效益是否重视,近年来有否明显的提高。145办学水平评价流程图目标决策办学水平办学过程办学质量146三、学校办学水平评价的方法有很多评价方法可以在办学水平的评价

122、中加以运用。比如,历届毕业生流向分析、岗位职务分析等可用于目标决策评价;现场调查、物资跟踪调查等可用于办学条件评价;计划的程序性分析、问卷调查、关键人物调查、教师队伍结构分析和社会结构网络分析等可用于办学过程评价;学业成就测验、教育方案的时间效益分析等可用于办学质量的评价。147四、学校办学水平评价中应注意的问题充分发挥学校教职员工的积极性评价运行激励机制问题148五、学校办学水平评价的运行激励机制评价活动的运行激励机制问题和人的需要等社评价活动的运行激励机制问题和人的需要等社会心理学问题有重要联系。这些问题包括人们会心理学问题有重要联系。这些问题包括人们参加评价的心理机制,评价障碍的心理原因

123、等。参加评价的心理机制,评价障碍的心理原因等。(一)学校办学水平评价运行激励机制的心理(一)学校办学水平评价运行激励机制的心理学基础学基础1 1、激励理论、激励理论按照心理学的观点,人的行为都是有一定动机按照心理学的观点,人的行为都是有一定动机的,而动机产生于人的需要。的,而动机产生于人的需要。需要是人行为的动机力量,需要和人的行为之需要是人行为的动机力量,需要和人的行为之间密切相关。间密切相关。评价由人的需要所激发,由人的需要所推动。评价由人的需要所激发,由人的需要所推动。1492、被评人对评价的需要被评对象对教育的需要是被评对象所有需要中引起他们接受、参与评价活动动机的一部分。这种需要主要

124、表现为以下几个方面:(1)资源需要(2)权威服从(3)认可需要(4)成就期望150(二)办学水平评价的运行方式评价活动的客观机制研究已往的评价是怎样发生、发展和运行的。一般来说,评价的运行,主要基于以下几种动因:(1)行政命令(2)与利益挂钩(3)调动成就期望151(三)评价启动和运行的策略1、评价启动、运行和管理理论(1)古典管理理论(X理论)(2)人际关系学派和行为科学理论(Y理论)(3)现代管理学派:权变理论(Z理论)1522、评价启动的权变参数(1 1)评价目的)评价目的评价启动的方法要从评价的目的出发。当评价评价启动的方法要从评价的目的出发。当评价的目的在于选优罚劣时,用什么启动评价

125、?的目的在于选优罚劣时,用什么启动评价?当评价的目的在于帮助被评对象改进工作时,当评价的目的在于帮助被评对象改进工作时,用什么启动评价?用什么启动评价?(2 2)系统状态)系统状态系统状态是指学校在实现其目标过程中的表现。系统状态是指学校在实现其目标过程中的表现。如果在总体上,学校系统处在较优良的水平上,如果在总体上,学校系统处在较优良的水平上,并且我们的教育部门对其又有较强的控制能力并且我们的教育部门对其又有较强的控制能力的话,运用什么启动评价?反之,则运用什么的话,运用什么启动评价?反之,则运用什么启动评价?启动评价?153(3 3)环境条件)环境条件主要指学校所处的外部环境。在外部环境有

126、利主要指学校所处的外部环境。在外部环境有利于教育工作者达成其目标,已经形成了一种有于教育工作者达成其目标,已经形成了一种有利于学校目标达成的外部氛围的情况下,从什利于学校目标达成的外部氛围的情况下,从什么入手启动评价是可行的?反之,则不可行。么入手启动评价是可行的?反之,则不可行。(4 4)人员素质)人员素质主要指被评人员的素质。被评人员事业心和责主要指被评人员的素质。被评人员事业心和责任心都比较强,用什么作为启动评价的主要手任心都比较强,用什么作为启动评价的主要手段是恰当的?反之,则需要运用什么等手段作段是恰当的?反之,则需要运用什么等手段作为首选方法。为首选方法。1543、现阶段我国教育评

127、价启动和运行的策略(1)研究我国学校面临的外部环境和内部条件从我国当前学校教育所处的环境和实际状态,我国学校教育评价的启动和运行应以什么方式为主?(2)做好广泛而又深入地宣传动员明确评价的意义明了评价的步骤切实了解本单位的工作进度155第七章 教师评价一、教师评价的意义和特点 (一)意义教师评价有利于教师端正教育思想教师评价有利于调动教师的积极性教师评价有利于教师改进工作教师评价有利于建设一支合格的教师队伍教师评价有利于教师的科学管理156(二)特点教师评价既具有直接性,又具有间接性教师评价既具有科学性,又具有政策性157二、教师评价的准则与标准教师评价的准则是指对教师评价内容的质的确教师评价

128、的准则是指对教师评价内容的质的确定,它确定评价活动评价什么不评价什么。定,它确定评价活动评价什么不评价什么。评价准则是评价活动方案的核心部分,是人们评价准则是评价活动方案的核心部分,是人们价值认识的反映,它表明了人们重视什么,忽价值认识的反映,它表明了人们重视什么,忽视什么,具有引导教师向何处努力的作用。视什么,具有引导教师向何处努力的作用。教师评价标准则是指相对于评价准则所规定的教师评价标准则是指相对于评价准则所规定的方面,所确定的对优良程度的要求,它是事物方面,所确定的对优良程度的要求,它是事物质变过程中量的规定性。质变过程中量的规定性。158(一)教师评价准则的确定1 1、从教育目标出发

129、确定教师评价准则;、从教育目标出发确定教师评价准则;2 2、从心理学原理出发确定教师评价准则;、从心理学原理出发确定教师评价准则;3 3、从教师经验出发确定教师评价准则;、从教师经验出发确定教师评价准则;4 4、从教师职责出发确定教师评价准则;、从教师职责出发确定教师评价准则;5 5、从教学效果出发确定教师评价准则。、从教学效果出发确定教师评价准则。小结:从以上的分析中可以看出,五种确定教小结:从以上的分析中可以看出,五种确定教师评价准则的方法都有一定的优点,也都存在师评价准则的方法都有一定的优点,也都存在一定的不足,需要在实践中不断地探索。而从一定的不足,需要在实践中不断地探索。而从教师评价

130、的实际来看,从教师经验出发来确定教师评价的实际来看,从教师经验出发来确定教师准则更加具有现实意义。教师准则更加具有现实意义。159教师评价准则包括: 1 1、教师素质评价、教师素质评价 主要是对教师的政治素质、文化素质和专业能力的评价。这方面主要是对教师的政治素质、文化素质和专业能力的评价。这方面的评价在教师的招聘、录用、晋升中运用较为广泛,它在一定程的评价在教师的招聘、录用、晋升中运用较为广泛,它在一定程度上可以表明一个人是否具有当好教师的潜在可能。这方面的内度上可以表明一个人是否具有当好教师的潜在可能。这方面的内容主要包括:(容主要包括:(1 1)思想素质;()思想素质;(2 2)文化素质

131、;()文化素质;(3 3)业务素质;)业务素质;(4 4)身体素质;()身体素质;(5 5)心理素质)心理素质 2 2、工作素质评价、工作素质评价 主要集中在对教师教学过程中所体现的外显行为的评价,目的在主要集中在对教师教学过程中所体现的外显行为的评价,目的在于帮助教师不断改进教学工作,提高质量。具体内容主要包括对于帮助教师不断改进教学工作,提高质量。具体内容主要包括对于教师在备课、上课、辅助作业、检查和批改、组织课外活动、于教师在备课、上课、辅助作业、检查和批改、组织课外活动、参加政治文化业务学习和教学研究,承担社会功用等方面的评价。参加政治文化业务学习和教学研究,承担社会功用等方面的评价。

132、 3 3、工作绩效评价、工作绩效评价 一般从工作数量和工作质量两个方面进行工作绩效评价。数量上一般从工作数量和工作质量两个方面进行工作绩效评价。数量上主要指教师的教学工作量、德育工作量、科研工作量、社会兼职主要指教师的教学工作量、德育工作量、科研工作量、社会兼职工作量;质量上主要指学生在德、智、体等方面表现出来的质量、工作量;质量上主要指学生在德、智、体等方面表现出来的质量、教育教学经验、科研成果等。教育教学经验、科研成果等。160(二)关于教师教学工作评价教学是教师实现培养目标、完成学校教育任务的基本方式,教学工作也是教师最主要的工作。通过教师的教学评价:可以有效地提高教师的教学水平,引导教

133、师按教学规律进行教学,不断提高教学质量;保证教学秩序、加强教师队伍管理科学化的重要措施。161教师课堂教学评价指标评价指标 很好 较好 一般 较差 教学目标 教学内容教学环节教学方法考试考核 162教师课堂教学质量评价指标评价指标 很好 较好 一般 较差学习兴趣基础知识能力培养思想认识特长发展163(三)关于教师科研工作评价教学工作虽然是教师最主要的工作,但随着教教学工作虽然是教师最主要的工作,但随着教育教学改革的深入,以科研促发展成为学校面育教学改革的深入,以科研促发展成为学校面临的现实选择。人们对于教师从事科研工作重临的现实选择。人们对于教师从事科研工作重要性的认识越来越明确,对教师科研工

134、作的评要性的认识越来越明确,对教师科研工作的评价,也逐渐成为教师评价的重要组成部分。价,也逐渐成为教师评价的重要组成部分。相对于教师的教学工作,教师的科研工作更容相对于教师的教学工作,教师的科研工作更容易进行精确的判断和衡量。实践中对教师科研易进行精确的判断和衡量。实践中对教师科研工作进行评价的方法主要有:工作进行评价的方法主要有:1 1、成果计数法;、成果计数法;2 2、引用分析法;、引用分析法;3 3、科研经、科研经费评价法;费评价法;4 4、同行评价、同行评价164三、教师评价的基本方法 1 1、学生评教、学生评教 学生评教是一种比较民主的形式,主要有问卷调查与座谈会两种形式。学生评教是

135、一种比较民主的形式,主要有问卷调查与座谈会两种形式。 学生学习情况调查表学生学习情况调查表 学科学科 讲授内容讲授内容 任课教师任课教师 填表人填表人 填表时间填表时间 1 1、本堂课家庭作业一般来说:太多;合适;太少。、本堂课家庭作业一般来说:太多;合适;太少。 2 2、完成上述作业所用的时间为、完成上述作业所用的时间为小时小时分分 3 3、你认为本堂课老师课堂讲课速度:太快;合适;太慢。、你认为本堂课老师课堂讲课速度:太快;合适;太慢。 4 4、你认为本堂课老师课堂讲授的内容:太多;合适;太少。、你认为本堂课老师课堂讲授的内容:太多;合适;太少。 5 5、你对本堂课老师所讲的内容:全懂;不

136、全懂;全不懂。、你对本堂课老师所讲的内容:全懂;不全懂;全不懂。 6 6、你对本堂课老师所讲内容的感觉是:太难;一般;容易。、你对本堂课老师所讲内容的感觉是:太难;一般;容易。 7 7、你对本堂课内容的兴趣:原来有兴趣,课后仍然有兴趣;原来无兴趣,、你对本堂课内容的兴趣:原来有兴趣,课后仍然有兴趣;原来无兴趣,课后有兴趣;原来有兴趣,课后无兴趣;原来无兴趣,课后仍然无兴趣。课后有兴趣;原来有兴趣,课后无兴趣;原来无兴趣,课后仍然无兴趣。 8 8、你课后就本、你课后就本 课所讲的内容请教老师、同学、家长等?是、否课所讲的内容请教老师、同学、家长等?是、否 9 9、你课后就本课内容请教他人次数:、

137、你课后就本课内容请教他人次数:;用了大约了时间?;用了大约了时间? 1010、你课后做家庭作业,不需看书就能做:看了书也不会做、你课后做家庭作业,不需看书就能做:看了书也不会做/ /。165教师自评同行评价领导评价专家评价166第八章学生评价一、学生评价概述一、学生评价概述(一)学生评价的作用(一)学生评价的作用1 1、学生评价有助于把握学习起点,选择教学、学生评价有助于把握学习起点,选择教学策略策略 ;2 2、学生评价有助于改进教学活动,改善学生、学生评价有助于改进教学活动,改善学生的行为表现;的行为表现;3 3、学生评价有助于了解学生发展中存在的困、学生评价有助于了解学生发展中存在的困难,

138、有针对性地解决问题;难,有针对性地解决问题;4 4、学生评价有助于使教师和学校全面了解学、学生评价有助于使教师和学校全面了解学生发展情况。生发展情况。167(二)传统学生评价制度及缺陷 1 1、学生评价个案剖析、学生评价个案剖析 例例1 1:老师,请看看我的闪光点:老师,请看看我的闪光点 例例2 2:“差生差生”的成绩的成绩 小结:以上的例子表明,长期以来形成的传统学生评价制度,过小结:以上的例子表明,长期以来形成的传统学生评价制度,过分强分强 调评价的总结性功能和选拔功能,把学生评价局限于为学校调评价的总结性功能和选拔功能,把学生评价局限于为学校管理服务,成为学校控制教师,教师管理学生的主要

139、手段。这种管理服务,成为学校控制教师,教师管理学生的主要手段。这种功能上的偏差,严重影响了学生评价积极作用的发挥,也引发了功能上的偏差,严重影响了学生评价积极作用的发挥,也引发了一系列相关问题。主要表现在:一系列相关问题。主要表现在: 1 1、把考试与测验作为学生评价的唯一形式,忽视了学生的全面评、把考试与测验作为学生评价的唯一形式,忽视了学生的全面评价;价; 2 2、形成了对分数的过分追求;、形成了对分数的过分追求; 3 3、学生评价过程中的随意性难以保证评价的客观、准确;、学生评价过程中的随意性难以保证评价的客观、准确; 4 4、学生评价难以产生有效的教育效应、学生评价难以产生有效的教育效

140、应168(三)现代学生评价制度的基本特征1 1、学生评价的功能重点逐步从总结性功能向、学生评价的功能重点逐步从总结性功能向形成性功能转移;形成性功能转移;2 2、评价内容从对学生的认知评价扩展为对学、评价内容从对学生的认知评价扩展为对学生全面综合性的评价;生全面综合性的评价;3 3、学生在评价过程中由被动等待评价向主动、学生在评价过程中由被动等待评价向主动参与评价发展;参与评价发展;4 4、学生评价从关注结果向重视过程发展;、学生评价从关注结果向重视过程发展;5 5、在评价方法上,从仅强调测验分数向评价、在评价方法上,从仅强调测验分数向评价方法的主体、综合、多层次、全方位发展。方法的主体、综合

141、、多层次、全方位发展。169二、学生学业成绩评价 学生学业成绩评价是指对学生个体学习进展和变化的评价。学生学业成绩评价是指对学生个体学习进展和变化的评价。 (一)学生学业成绩评价的步骤(一)学生学业成绩评价的步骤 1 1、准备阶段、准备阶段 确定评价目的是进行评价准备的首要任务;确定评价目的是进行评价准备的首要任务; 其次,要确定评价目标并考虑可能的非预期效应;其次,要确定评价目标并考虑可能的非预期效应; 再次,对于大型的评价还需要组织准备和方法准备。再次,对于大型的评价还需要组织准备和方法准备。 2 2、实施阶段、实施阶段 笔试笔试 学生作品学生作品 教师观察与学生交流教师观察与学生交流 课

142、堂评价课堂评价 3 3、对结果的分析阶段、对结果的分析阶段 整理整理 分析分析 反馈反馈170(二)学生学业成绩评价中应注意的几个问题 1 1、作好测验编制工作、作好测验编制工作 第一,测验题目必须紧扣教育目标,不应出偏题、怪题。第一,测验题目必须紧扣教育目标,不应出偏题、怪题。 第二,测验题目应有较广泛的覆盖面。第二,测验题目应有较广泛的覆盖面。 2 2、正确认识和处理学生学业成绩评价中的分数、正确认识和处理学生学业成绩评价中的分数 由百分制到等级分制改革,赞同者的观点:由百分制到等级分制改革,赞同者的观点: 第一,等级分制改革使学生评价更为合理,有利于在评价结构中第一,等级分制改革使学生评

143、价更为合理,有利于在评价结构中淡化认知领域的评价,改变在学生评价中过分倚重认知领域,轻淡化认知领域的评价,改变在学生评价中过分倚重认知领域,轻视非认知领域的现象;视非认知领域的现象; 第二,等级分制淡化了分数竞争,使学生有时间、有氛围发展个第二,等级分制淡化了分数竞争,使学生有时间、有氛围发展个性特长,有利于学生的全面发展;性特长,有利于学生的全面发展; 第三,有利于教师在观念上由第三,有利于教师在观念上由“应试教育应试教育”向素质教育转变;向素质教育转变; 第四,有利于促进学校教学和管理上的改革;第五,有利于促进第四,有利于促进学校教学和管理上的改革;第五,有利于促进初中就近入学和薄弱学校的

144、改造初中就近入学和薄弱学校的改造171反对者观点:1、百分记分法确实有很多弊端,但从理论上说,无论是百分制还是等级分制,都不是一种理想的记分方法,都难以反映学生具体的学习状况;2、两者都正在受到教育实践界和教育理论界的批评。172三、学生品德测评 品德测评是指根据一定的目标、运用科学的手段,对品德测评是指根据一定的目标、运用科学的手段,对学生的政治品质、道德品质、思想品质(包括知、情、学生的政治品质、道德品质、思想品质(包括知、情、意、行)的测试和评定。意、行)的测试和评定。 (一)品德测评的意义(一)品德测评的意义 1 1、有利于学生思想上的自我教育和学校德育工作顺利、有利于学生思想上的自我

145、教育和学校德育工作顺利开展开展 2 2、有利于学生德育管理和激励先进和鞭策后进、有利于学生德育管理和激励先进和鞭策后进 3 3、有利于促进德育目标的实现和德育质量的提高、有利于促进德育目标的实现和德育质量的提高 4 4、是德育工作科学化的保证、是德育工作科学化的保证 5 5、有利于发挥评价的教育功能、有利于发挥评价的教育功能 6 6、有利于学校德育改革、有利于学校德育改革173(二)品德测评的内容政治素质思想素质道德素质法纪素质心理素质174(三)品德测评应注意的事项1 1、在广阔的视野中测评、在广阔的视野中测评2 2、从长远的观点测评、从长远的观点测评3 3、许多人共同测评、许多人共同测评4

146、 4、减少测评过程中的误差、减少测评过程中的误差宽容误差宽容误差中心化倾向中心化倾向晕轮效应晕轮效应理论误差理论误差对比误差对比误差175(四)品德测评的方法1、情境测试法即通过创设一种情境,根据对象对情境或在情境条件下作出反应,对被测评对象的品德发展作出评价的一种方法。(1)两难问题测试(2)诚实性测试(3)公正性测试1762、投射法投射法是用比较不完整的、模棱两可的刺激物,了解被试者恶人的欲求情感、价值观、适应方式等心理机制的方法。用视觉作刺激物(主题统觉测验、绘画欲求不满测验)用言语作刺激物(句子完成法、故事完成法)用游戏和戏剧等表现活动作刺激物(游戏手法、心理剧)1773、档案袋评价法

147、是教师依据教学目标与计划,请学生持续一段时间主动收集、组织与省思学习成果的档案,以评定其努力、进步、成长情形的一种评价方法。用档案袋评价方法来了解学生的成长历程与发展进步,其想法源自于艺术家的作品档案袋。178档案袋方法的优缺点。优点:。优点:重视学生发展的全过程,能记录学生的成长过重视学生发展的全过程,能记录学生的成长过程;程;能够提供丰富多样的评价材料;能够提供丰富多样的评价材料;能够针对每一位学生进行评价、评价具有个性能够针对每一位学生进行评价、评价具有个性和针对性;和针对性;能够使学生体验成功、感受成长和进步;能够使学生体验成功、感受成长和进步;可以培养学生主动积极、自我成长、自我评价

148、、可以培养学生主动积极、自我成长、自我评价、自我负责的精神及价值观;自我负责的精神及价值观;可以增进师生互动、同学沟通、合作精神等可以增进师生互动、同学沟通、合作精神等179缺点:档案袋评价工作量太大,教师负担过重;档案袋评价工作量太大,教师负担过重;档案袋评价的标准化与客观化程度较低,因而档案袋评价的标准化与客观化程度较低,因而带来评价的信度和效度有时难以保证;带来评价的信度和效度有时难以保证;档案袋评价的内容太多,不好选择,不好整理、档案袋评价的内容太多,不好选择,不好整理、分析;分析;档案袋评价容易走形式,走过场;档案袋评价容易走形式,走过场;档案袋评价技术的应用,往往需要有一定的经档案

149、袋评价技术的应用,往往需要有一定的经费投入,这也可能给学校经费预算以及学生家费投入,这也可能给学校经费预算以及学生家庭经济带来一定困难;庭经济带来一定困难;档案袋评价不适合用于大班评价。档案袋评价不适合用于大班评价。1804、操行评语法这种方法是品德测评者根据自己对学生某个时期有关表现的观察和了解,参照有关标准,以简短的陈述句形式,概括地总结出学生在该时期的品德表现状况和发展水平。评语要求:全面、真实、具体、鼓励。操行评语法是目前学校应用最为广泛的方法。由于这种方法是以总体印象为基础,因而主观随意因素较重,而且常常出现千人一面的情况。1815、等第法 这种方法是按照一定标准对被评价者的品德水这

150、种方法是按照一定标准对被评价者的品德水 平和平和状况予以总结性的等第评定,以显示品德发展水平的状况予以总结性的等第评定,以显示品德发展水平的差异。差异。 操作步骤:操作步骤: 先确定测评内容和标准,然后让学生自评自报,学生先确定测评内容和标准,然后让学生自评自报,学生小组进行评论,再由班主任征求科任教师意见,结合小组进行评论,再由班主任征求科任教师意见,结合小组评议结果及平时观察评出等第,最后由学校审定。小组评议结果及平时观察评出等第,最后由学校审定。 等第法对学生品德发展虽然能分出发展层次和等级,等第法对学生品德发展虽然能分出发展层次和等级,促进学生之间的比学赶超,但也存在过于高度概括化促进

151、学生之间的比学赶超,但也存在过于高度概括化的问题,难以反映品德发展中方方面面的情况。在实的问题,难以反映品德发展中方方面面的情况。在实际工作中,学校或教师常常将等第法与评语法结合使际工作中,学校或教师常常将等第法与评语法结合使用。用。1826、评等评分测评法这种方法是先拟定一定数量的测评标准,测评这种方法是先拟定一定数量的测评标准,测评时按个人、小组、教师分别逐项对照标准进行时按个人、小组、教师分别逐项对照标准进行评定。先判断等级,然后按规定转为分值,并评定。先判断等级,然后按规定转为分值,并将分值填在相应的栏目中,最后综合为一个总将分值填在相应的栏目中,最后综合为一个总分并转为等第。分并转为

152、等第。在具体使用中又有不同的变化如有的只分项目在具体使用中又有不同的变化如有的只分项目评等不综合,有的则把各项目分为只评等不评评等不综合,有的则把各项目分为只评等不评分的项目和评分不评等的项目,进行分别处理分的项目和评分不评等的项目,进行分别处理等等。等等。1837、评等评分评语综合测评法这是对上述各种测评方法兼容综合的方法。是这是对上述各种测评方法兼容综合的方法。是在得出分数、等第之后,再加评语,以解释等在得出分数、等第之后,再加评语,以解释等级分数的意义,定性说明被评价者的品德个性级分数的意义,定性说明被评价者的品德个性与特点。与特点。具体操作是:先按标准逐项分等评分,再综合具体操作是:先

153、按标准逐项分等评分,再综合得到总分及等第,最后依据分项及综合评定提得到总分及等第,最后依据分项及综合评定提供的信息写出评语。供的信息写出评语。这种方法由于比较客观、具体,而且能较全面这种方法由于比较客观、具体,而且能较全面地反映被评价者品德情况,因而应用较广。地反映被评价者品德情况,因而应用较广。184(五)当前思想品德评价中存在的主要问题 1 1、品德测评指标的设计问题、品德测评指标的设计问题 科学的品德测评在很大程度上依赖于指标体系的科学化。从目前科学的品德测评在很大程度上依赖于指标体系的科学化。从目前的品德测评工作的实践来看,指标体系的设计质量依然存在许多的品德测评工作的实践来看,指标体

154、系的设计质量依然存在许多不尽如人意之处,其中问题较为突出的便是指标体系的可操作性不尽如人意之处,其中问题较为突出的便是指标体系的可操作性问题。为了保证品德测评的有效性和可靠性,品德测评目标体系问题。为了保证品德测评的有效性和可靠性,品德测评目标体系的制定,一般要求其规定的内涵非常准确,使评价者对它们都能的制定,一般要求其规定的内涵非常准确,使评价者对它们都能有一个客观公正的认识。有一个客观公正的认识。 在现实中,人们为了求得指标的可操作性,将指标体系设置得过在现实中,人们为了求得指标的可操作性,将指标体系设置得过分细致和具体,甚至出现了包含几十条指标的庞大指标体系。但分细致和具体,甚至出现了包

155、含几十条指标的庞大指标体系。但其效果却适得其反,由于其过大过重的工作量而不被人们所欢迎其效果却适得其反,由于其过大过重的工作量而不被人们所欢迎和接受。但如果指标过于笼统、抽象,人们无法通过指标去获得和接受。但如果指标过于笼统、抽象,人们无法通过指标去获得有关应测评对象的思想品德特征的信息,那么,测评的有效性就有关应测评对象的思想品德特征的信息,那么,测评的有效性就会受到影响。因此,如何兼顾品德测评指标体系的客观性和可操会受到影响。因此,如何兼顾品德测评指标体系的客观性和可操作性是品德测评研究中人们关注的重点。作性是品德测评研究中人们关注的重点。1852、品德测评的量化问题目前,全国各地中小学品

156、德测评,普遍喜欢实目前,全国各地中小学品德测评,普遍喜欢实行量化。科学而又合理的量化具有以下现实意行量化。科学而又合理的量化具有以下现实意义:义:有助于克服品德测评过程的许多主观臆断性;有助于克服品德测评过程的许多主观臆断性;有助于提高学生品德测评的效率与效果;有助于提高学生品德测评的效率与效果;有助于德育管理与德育研究;有助于德育管理与德育研究;有助于强化德育工作。有助于强化德育工作。但目前人们在品德测评过程中存在着随意但目前人们在品德测评过程中存在着随意“量量化化”与简单与简单“量化量化”的现象,甚至把的现象,甚至把“量化量化”加以滥用乱用,远远超出加以滥用乱用,远远超出“量化量化”本身的

157、功能本身的功能范围,使人们对此提出了不少批评。范围,使人们对此提出了不少批评。186质疑一 “量化量化”是否能全面、真实、精确地反映学生的真实是否能全面、真实、精确地反映学生的真实水平。水平。“量化量化”实际上只重视对学生行为结果的评分,实际上只重视对学生行为结果的评分,并不注意行为过程,因此有些学生的行为不是出于对并不注意行为过程,因此有些学生的行为不是出于对品德测评目标的自觉遵守,而是为了躲避扣分,争取品德测评目标的自觉遵守,而是为了躲避扣分,争取高分,是一种表面行为。这样就导致学生品德得分的高分,是一种表面行为。这样就导致学生品德得分的多少与他们的实际水平挂不上钩。多少与他们的实际水平挂

158、不上钩。 此外,尽管量化测评所获得的资料可靠且重要,但它此外,尽管量化测评所获得的资料可靠且重要,但它只是测评者对感性认识的量表赋值,还需要在此基础只是测评者对感性认识的量表赋值,还需要在此基础上进行定性分析。上进行定性分析。 人的思想信念与品德素质往往是众多行为特征的抽象人的思想信念与品德素质往往是众多行为特征的抽象综合。必须使品德的多侧面、多因素有机统一才能得综合。必须使品德的多侧面、多因素有机统一才能得出带有整体性的综合性特征的理性评定,才能由此测出带有整体性的综合性特征的理性评定,才能由此测评出学生品德的真实水平。评出学生品德的真实水平。187质疑二品德所有的特征成分是否都可以量化。品

159、德测品德所有的特征成分是否都可以量化。品德测评总要求以可观察的外显行为为依据,重视现评总要求以可观察的外显行为为依据,重视现实的表现,而测评的重点却是深层的思想动机,实的表现,而测评的重点却是深层的思想动机,测评的对象学生(特别是小学生)正处于不断测评的对象学生(特别是小学生)正处于不断变化和发展的时期。变化和发展的时期。学生品德评定的这种特殊性决定了品德测评有学生品德评定的这种特殊性决定了品德测评有的内容可以量化,如的内容可以量化,如“完成作业完成作业”“”“参加劳动参加劳动”等;有的内容难以量化,例如等;有的内容难以量化,例如“尊老爱幼尊老爱幼”、“诚实勇敢诚实勇敢”“”“热爱祖国热爱祖国

160、”、“热爱人民热爱人民”等。因此,品德评定应以定性为主。等。因此,品德评定应以定性为主。1883、思想品德测评方法实践可行性的问题 在思想品德测评中,人们总是刻意追求它在理论上的在思想品德测评中,人们总是刻意追求它在理论上的完善性和方法上的先进性。如目前有关研究人员提出完善性和方法上的先进性。如目前有关研究人员提出采用模糊数学或其他先进计量手段的测评方法。虽然采用模糊数学或其他先进计量手段的测评方法。虽然它们在技术上都有一定的先进性和科学性,但中小学它们在技术上都有一定的先进性和科学性,但中小学教师却不愿接受或难以接受,主要是计算操作繁琐,教师却不愿接受或难以接受,主要是计算操作繁琐,不便人们

161、使用。不便人们使用。 因此,如何使思想品德评价更具针对性,能科学而准因此,如何使思想品德评价更具针对性,能科学而准确地确定学生发展的水平,仍需要广大教育工作者在确地确定学生发展的水平,仍需要广大教育工作者在实践中继续进行探索。实践中继续进行探索。189四、能力测评 能力测评主要用于测量被试所具有的实际能力和可能具有的潜在能力测评主要用于测量被试所具有的实际能力和可能具有的潜在能力。能力。 一、能力测评的理论基础一、能力测评的理论基础 (一)智力及其有关理论(一)智力及其有关理论 智力一词早已为人们所熟悉,甚至智商(智力一词早已为人们所熟悉,甚至智商(IQIQ)的概念也已成为日)的概念也已成为日

162、常生活的常用词,但对什么是智力,目前还没有一致的见解,人常生活的常用词,但对什么是智力,目前还没有一致的见解,人们发现很难给能力下一个很理想的定义,于是,一些心理学家将们发现很难给能力下一个很理想的定义,于是,一些心理学家将注意力转向智力结构的研究,提出了智力二因素论、智力多因素注意力转向智力结构的研究,提出了智力二因素论、智力多因素论等理论。论等理论。 1 1、二因素论、二因素论 2 2、多因素论、多因素论 3 3、群因素论、群因素论 4 4、智力结构论、智力结构论 5 5、多维智力论、多维智力论 6 6、三重智力理论、三重智力理论190二因素论二因素论认为智力是由一般因素(G)和特殊因素(

163、S)构成的。进行各种认识活动和完成任何作业任务都需要这两种因素参加,但G因素是完成任何作业所必须的共同因素,S因素则因作业不同而异,个人智力的高低主要决定于G因素。持这种观点的代表人物是斯皮尔曼。191多因素论多因素论认为不存在一般因素贯穿于所有智力多因素论认为不存在一般因素贯穿于所有智力之中,在不同的智力活动中,即使有某些一般之中,在不同的智力活动中,即使有某些一般因素存在,也是高度特殊化了的。因素存在,也是高度特殊化了的。美国心理学家桑代克早在美国心理学家桑代克早在19261926就指出了构成智就指出了构成智力的多个因素力的多个因素(1 1)抽象智力或有效地应用概)抽象智力或有效地应用概念

164、或符号的能力;(念或符号的能力;(2 2)社会智力或与人相处)社会智力或与人相处的能力;(的能力;(3 3)机械智力或处理具体事物或情)机械智力或处理具体事物或情境的能力。而且,他认为这种智力,还有层次境的能力。而且,他认为这种智力,还有层次(高度)、距离(广度)和敏捷(速度)三个(高度)、距离(广度)和敏捷(速度)三个纬度,所以智力测验内容应包括智力的三个纬纬度,所以智力测验内容应包括智力的三个纬度。度。192群因素论美国心理学家瑟斯顿进一步发展了多因素的观美国心理学家瑟斯顿进一步发展了多因素的观点,他采用因素分析的方法,得出了构成能力点,他采用因素分析的方法,得出了构成能力的七种独立的基本

165、因素的七种独立的基本因素(1 1)空间因素;()空间因素;(2 2)数量因素;(数量因素;(3 3)知觉因素;()知觉因素;(4 4)言语因素;)言语因素;(5 5)言语的流畅性因素;()言语的流畅性因素;(6 6)记忆因素;)记忆因素;(7 7)推理因素。他认为一个人的智力就是由)推理因素。他认为一个人的智力就是由其中的一种因素为核心,由其他因素参加而组其中的一种因素为核心,由其他因素参加而组合成的。由于各人的核心因素及参加组合的因合成的。由于各人的核心因素及参加组合的因素不同,所以人与人之间的能力类型和能力水素不同,所以人与人之间的能力类型和能力水平也不同。平也不同。193智力结构论 美国

166、心理学家吉尔福特,于美国心理学家吉尔福特,于19671967年提出了智力的三维年提出了智力的三维结构论。他用内容、操作和成果三个变动构成的立体结构论。他用内容、操作和成果三个变动构成的立体模型来描述智力结构,其中内容是引起智力活动的各模型来描述智力结构,其中内容是引起智力活动的各种刺激物。亦即智力测验所包括的各类题目;种刺激物。亦即智力测验所包括的各类题目; 操作是指由各种刺激物引起的智力活动方式;操作是指由各种刺激物引起的智力活动方式; 成果是指智力活动的产物,即应用各种智力对各类问成果是指智力活动的产物,即应用各种智力对各类问题处理的结果。题处理的结果。 每一种内容都可引起不同的操作而产生

167、不同的结果。每一种内容都可引起不同的操作而产生不同的结果。 因此三个变项就可组成很多种单独的智力因素(他认因此三个变项就可组成很多种单独的智力因素(他认为有为有150150种之多),有人认为,吉尔福特的理论将智力种之多),有人认为,吉尔福特的理论将智力分解得支离破碎,无助于智力的理解,但从智力测验分解得支离破碎,无助于智力的理解,但从智力测验的角度来看,这种理论是有重要的参考价值的。的角度来看,这种理论是有重要的参考价值的。194多维智力论(多元智力理论) 美国哈佛大学心理学教授贾德纳的多维智力理论受到美国哈佛大学心理学教授贾德纳的多维智力理论受到吉尔福特的智力结构论的影响,他强调人类智慧至少

168、吉尔福特的智力结构论的影响,他强调人类智慧至少应包括以下应包括以下7 7种不同的智力种不同的智力(1 1)言语智力;(言语智力;(2 2)数理)数理逻辑智力;(逻辑智力;(3 3)空间智力;()空间智力;(4 4)音乐智力;()音乐智力;(5 5)体)体能智力;(能智力;(6 6)人际智力;()人际智力;(7 7)自知智力。)自知智力。 贾德纳认为,传统的智力测验只是测试了言语智力和贾德纳认为,传统的智力测验只是测试了言语智力和数理逻辑智力,忽视了其他的智力。在贾德纳的观念数理逻辑智力,忽视了其他的智力。在贾德纳的观念中,上述中,上述7 7种智力在人们的实际生活中是同等重要的,种智力在人们的实

169、际生活中是同等重要的,并无主次之分。并无主次之分。 他还指出,由于时代的不同和文化上的差异,这他还指出,由于时代的不同和文化上的差异,这7 7种智种智力在人们心目中的重要性是常有转移的。力在人们心目中的重要性是常有转移的。195三重智力理论 美国耶鲁大学心理学教授斯腾伯格的三重智力理论在当今有较大美国耶鲁大学心理学教授斯腾伯格的三重智力理论在当今有较大的影响。这一理论从主体的内部世界、现实的外部世界以及联系的影响。这一理论从主体的内部世界、现实的外部世界以及联系内外经验世界这三个角度着手来分析智力,并与之对应提出了三内外经验世界这三个角度着手来分析智力,并与之对应提出了三类不同的智力:成分智力

170、、情境智力和经验智力。类不同的智力:成分智力、情境智力和经验智力。 成分智力是对智力活动内部机制的刻画,即指个体施用语言或动成分智力是对智力活动内部机制的刻画,即指个体施用语言或动作技能,在解决实际问题时表现于思考、计划、判断、执行等心作技能,在解决实际问题时表现于思考、计划、判断、执行等心智活动中的能力。包括:元成分、知识获得成分、操作成分。智活动中的能力。包括:元成分、知识获得成分、操作成分。 情境智力系指个体与环境互动时所表现出来的改变环境适应自己情境智力系指个体与环境互动时所表现出来的改变环境适应自己或改变自己适应环境以达到生活目的的实用性智力。它主要包括:或改变自己适应环境以达到生活

171、目的的实用性智力。它主要包括:适应环境的能力、改变环境的能力、选择能力。适应环境的能力、改变环境的能力、选择能力。 经验智力系指个体善于运用经验,形成新观念,对新事物处理时经验智力系指个体善于运用经验,形成新观念,对新事物处理时能迅速进入情况,且能表现高度工作效率的能力。它包括:处理能迅速进入情况,且能表现高度工作效率的能力。它包括:处理新异性的能力和自动化信息加工能力。新异性的能力和自动化信息加工能力。 斯腾伯格为我们描绘了一个较为全面的智力构成画面,这个画面斯腾伯格为我们描绘了一个较为全面的智力构成画面,这个画面比起传统的智力概念显然要丰满、立体得多,它强调了适应环境比起传统的智力概念显然

172、要丰满、立体得多,它强调了适应环境与改造经验亦是人类智力的表现。但根据斯腾伯格对智力理解,与改造经验亦是人类智力的表现。但根据斯腾伯格对智力理解,如何进行智力测验,目前还没有解决这个问题。如何进行智力测验,目前还没有解决这个问题。196(二)智力测验 智力测验是对人的智力的一种客观的、标准化的测量。智力测验是对人的智力的一种客观的、标准化的测量。它以一组标准刺激物引起被试的反应,根据这些客观它以一组标准刺激物引起被试的反应,根据这些客观反应来度量被试的智力高低。这组标准刺激物称为量反应来度量被试的智力高低。这组标准刺激物称为量表。表。 智力测验有助于诊断学生的智力发展情况,有利于因智力测验有助

173、于诊断学生的智力发展情况,有利于因材施教,对于提高学习效果以及选拔人才都有重要的材施教,对于提高学习效果以及选拔人才都有重要的作用。作用。 1 1、比纳量表、比纳量表 2 2、韦克斯勒量表、韦克斯勒量表 3 3、中国、中国3636岁儿童发展量表岁儿童发展量表 4 4、瑞文推理测验、瑞文推理测验 5 5、团体智力测试、团体智力测试197比纳量表比纳智力量表最早产生于比纳智力量表最早产生于19051905年,推孟曾对比年,推孟曾对比纳智力量表作过三次修订,第一次是在纳智力量表作过三次修订,第一次是在19161916年,年,第二次是在第二次是在19371937年,第三次是在年,第三次是在196019

174、60年。年。智商(智商(IQIQ)= =智龄(智龄(MAMA)/ /实龄(实龄(CACA)100100(比率智商)(比率智商)施测要严格按测验指南进行,先用比被试施测要严格按测验指南进行,先用比被试者实际年龄略低的年龄组的试题施测,若任何者实际年龄略低的年龄组的试题施测,若任何一项通不过,就使用更低的年龄组(基础年龄)一项通不过,就使用更低的年龄组(基础年龄)的题目测验,直到使用项目都失败的年龄(上的题目测验,直到使用项目都失败的年龄(上限年龄)为止。最后根据被试者的实龄和测验限年龄)为止。最后根据被试者的实龄和测验总分,从测验指南中查出智商,与常模对总分,从测验指南中查出智商,与常模对照,评

175、价被试者的智力水平。照,评价被试者的智力水平。198韦克斯勒量表 是美国心理学家韦克斯勒编制的。包括韦氏儿童智力量表(是美国心理学家韦克斯勒编制的。包括韦氏儿童智力量表(616616岁)、韦氏成人智力量表(岁)、韦氏成人智力量表(1616岁以上)、韦氏幼儿智力量表(岁以上)、韦氏幼儿智力量表(446 6岁半)。韦氏测验量表的编制是以韦克斯勒对智力的认识为理论岁半)。韦氏测验量表的编制是以韦克斯勒对智力的认识为理论依据的,是当今少数最具有影响的智力量具之一。依据的,是当今少数最具有影响的智力量具之一。 韦氏智力量表属个别量表。按手册中规定的项目(言语项目和操韦氏智力量表属个别量表。按手册中规定的

176、项目(言语项目和操作项目)和顺序逐一进行测验。一个分测验各题所得分数相加,作项目)和顺序逐一进行测验。一个分测验各题所得分数相加,即得到这个测验的原始分数,把原始分数按手册上相量表换算成即得到这个测验的原始分数,把原始分数按手册上相量表换算成标准分。使用时还应注意成人和幼儿智力测验两个量表。标准分。使用时还应注意成人和幼儿智力测验两个量表。 IQ=100+15ZIQ=100+15Z,其中,其中Z=Z=(X-X*X-X*)/S/S(离差智商)(离差智商) 用这种离差智商可以确定一个人的智力在同龄人中的相对位置,用这种离差智商可以确定一个人的智力在同龄人中的相对位置,且不受个体年龄增大的影响。韦氏

177、量表把智商在且不受个体年龄增大的影响。韦氏量表把智商在6969以下称为以下称为“心心理缺陷理缺陷”,智商在,智商在130130以上称为以上称为“非常优秀非常优秀”。199中国36岁儿童发展量表当前,国内流行的幼儿心理测验多是自国外引进,再加以修订而成的,并且大多数是用于智能的筛选。针对这种情况,1985年张厚粲教授主持下开始编制该量表。它是以我国儿童发展研究成果为基础,适于几逆行能够我国儿童发展诊断的量表。该量表分为智力发展量表与运动发展量表两个部分,共由16个项目构成。200瑞文推理测验瑞文推理测验是英国心理学家瑞文瑞文推理测验是英国心理学家瑞文19381938年设计年设计的非文字智力测验。

178、它的优点在于适用的年龄的非文字智力测验。它的优点在于适用的年龄范围宽,测验对象不受文化、种族与语言的限范围宽,测验对象不受文化、种族与语言的限制,并且可用于一些生理缺陷者。制,并且可用于一些生理缺陷者。瑞文推理测验是一种团体智力测验。包括瑞文瑞文推理测验是一种团体智力测验。包括瑞文彩图推理测验彩图推理测验水平最低(幼儿或智力低下者)水平最低(幼儿或智力低下者)、瑞文标准推理测验、瑞文标准推理测验中等水平(中等水平(5 5岁半以上岁半以上正常者)、瑞文高级推理测验正常者)、瑞文高级推理测验水平最高(高水平最高(高智力水平被试)智力水平被试)201团体智力测试 团体测验法在教育上应用已久,但团体的

179、智力测验却团体测验法在教育上应用已久,但团体的智力测验却直到第一次世界大战期间,才得到飞速发展和广泛应直到第一次世界大战期间,才得到飞速发展和广泛应用,到用,到3030年代这些测验的发展达到高潮。年代这些测验的发展达到高潮。 团体测验最初只是作为个别测验的替代物,用以提高团体测验最初只是作为个别测验的替代物,用以提高效率。虽至今仍在这个意义上使用,但团体智力测验效率。虽至今仍在这个意义上使用,但团体智力测验的几种变式已经有了独自存在的价值。如用来预测学的几种变式已经有了独自存在的价值。如用来预测学业成就的学习能力测验,用于工、商业部门选人的职业成就的学习能力测验,用于工、商业部门选人的职业测验

180、等。它具有程序简便、效率高、实用性强和测业测验等。它具有程序简便、效率高、实用性强和测验更容易标准化等优点。验更容易标准化等优点。 其缺点是:主试无法直接观察被试的反应;题目类型其缺点是:主试无法直接观察被试的反应;题目类型受到限制,过多采用选择题不利于有独创性的被试;受到限制,过多采用选择题不利于有独创性的被试;对每个被试都施测全部题目,缺乏灵活性。对每个被试都施测全部题目,缺乏灵活性。202(三)创新能力测验 1 1、创新有三个层次的含义:一是引入新的或者是重新、创新有三个层次的含义:一是引入新的或者是重新组合的,二是再次发现的,三是新发现与创造前所未组合的,二是再次发现的,三是新发现与创

181、造前所未有的。可见,创新是一个比创造更宽泛的概念。有的。可见,创新是一个比创造更宽泛的概念。 2 2、对学生创新能力发展的评估方法、对学生创新能力发展的评估方法 (1 1)观察评估)观察评估 (2 2)通过研究性学习加以评估)通过研究性学习加以评估 (3 3)科技作品分析法)科技作品分析法 (4 4)评定量表评价法)评定量表评价法 3 3、创造力测验、创造力测验 (1 1)托兰斯创造思维测验)托兰斯创造思维测验 (2 2)南加尼福利亚大学测验)南加尼福利亚大学测验203(四)能力倾向发展测验能力倾向是指一个人获得新的知识、能力和技能的内在潜力。1、学习能力倾向测验2、职业能力倾向测验204五、

182、人格测量心理素质关系到人生的成败。美国教育家戴尔心理素质关系到人生的成败。美国教育家戴尔 卡耐基调查了各界许多名人之后认为,一个人卡耐基调查了各界许多名人之后认为,一个人事业上的成功,只有事业上的成功,只有15%15%是由于他们的学识和是由于他们的学识和专业技术,而专业技术,而85%85%是靠良好的心理素质和善于是靠良好的心理素质和善于处理人际关系。处理人际关系。现代社会对人的心理素质提出了越来越高的要现代社会对人的心理素质提出了越来越高的要求,如何帮助今天的儿童、青少年提高心理素求,如何帮助今天的儿童、青少年提高心理素质,健全人格,增强承受各种心理压力和处理质,健全人格,增强承受各种心理压力

183、和处理心理危机的能力,是我们每个教育工作者所面心理危机的能力,是我们每个教育工作者所面临的迫切问题。作为心理教育的重要手段之一,临的迫切问题。作为心理教育的重要手段之一,对学生心理进行测量和评价就显得尤为重要。对学生心理进行测量和评价就显得尤为重要。205(一)人格测量理论 一般情况下,编制人格测验都是以一定的人格理论为基础的。一般情况下,编制人格测验都是以一定的人格理论为基础的。人格理论提出人格的定义,限定人格的内在含义和外延范围,设人格理论提出人格的定义,限定人格的内在含义和外延范围,设定人格特征的纬度。这些都是人格测验编制的明确的理论依据。定人格特征的纬度。这些都是人格测验编制的明确的理

184、论依据。同时,人格理论的产生也与心理学中的实验趋向和个别差异的研同时,人格理论的产生也与心理学中的实验趋向和个别差异的研究有关,心理测量是人格理论产生的不可缺少的促进因素。人格究有关,心理测量是人格理论产生的不可缺少的促进因素。人格理论与人格测量关系密切。理论与人格测量关系密切。 1 1、特质理论、特质理论 特质理论是人格理论中影响最大的一种理论,它由美国心理学阿特质理论是人格理论中影响最大的一种理论,它由美国心理学阿尔波特在尔波特在2020世纪世纪4040年代首先提出。年代首先提出。 阿尔波特认为个体的行为方式可以看作是个体的人格结构,而个阿尔波特认为个体的行为方式可以看作是个体的人格结构,

185、而个体的人格结构又是由许多基本的、稳定的、一般性特征单元有机体的人格结构又是由许多基本的、稳定的、一般性特征单元有机地组合而成的。这些基本的特征单元就是特质。也就是说,特质地组合而成的。这些基本的特征单元就是特质。也就是说,特质隐藏在人的行为方式和心理操作之后,但是它是人的行为的差异隐藏在人的行为方式和心理操作之后,但是它是人的行为的差异或一致性的真正的原因。或一致性的真正的原因。 2 2、非智力因素的研究、非智力因素的研究206(二)人格测量的种类 长期以来,哲学家、心理学家以及其他研究领域的学者们,对人长期以来,哲学家、心理学家以及其他研究领域的学者们,对人格进行了大量研究,伴随着这些研究

186、而出现的各种对人格的测量格进行了大量研究,伴随着这些研究而出现的各种对人格的测量手段也层出不穷。从方法上归类,人格测验可分为两大类:手段也层出不穷。从方法上归类,人格测验可分为两大类: 1 1、问卷式人格测验、问卷式人格测验 问卷法所用的工具为各种量表,一般是经过标准化处理的测验量问卷法所用的工具为各种量表,一般是经过标准化处理的测验量表,也可称之为问卷。表,也可称之为问卷。 测验量表的结构明确,编制严谨,任务明确,包括很多测验量表的结构明确,编制严谨,任务明确,包括很多 具体问题,从不同角度来了解受测者的情况。问卷式人格测验又具体问题,从不同角度来了解受测者的情况。问卷式人格测验又可以分为两

187、类:一类为自陈量表;一类为评定量表。可以分为两类:一类为自陈量表;一类为评定量表。 2 2、投射测验、投射测验 这类测验所用的刺激多为意义不明确的各种图形、墨迹或数字,这类测验所用的刺激多为意义不明确的各种图形、墨迹或数字,让被试者在不受限制的情境下,自由地作出反应,由对反应结果让被试者在不受限制的情境下,自由地作出反应,由对反应结果的分析来推断其人格。的分析来推断其人格。 3 3、人格评估的其他方法、人格评估的其他方法 如:人格客观测量、人格行为观察法。如:人格客观测量、人格行为观察法。207(三)自陈量表 1 1、自陈量表的含义及特点、自陈量表的含义及特点 自陈量表是人格测验最常用的形式。

188、所谓自陈,就是让受测者自自陈量表是人格测验最常用的形式。所谓自陈,就是让受测者自己提供关于自身人格特征的情况。己提供关于自身人格特征的情况。 自陈量表大多采用客观测验的形式,在量表中包含一系列陈述句自陈量表大多采用客观测验的形式,在量表中包含一系列陈述句或问题,每个句子或问题描述一种行为特征,要求受测者作出是或问题,每个句子或问题描述一种行为特征,要求受测者作出是否符合自己情况的回答。如:否符合自己情况的回答。如: 例例1 1,我无事喜欢上街游荡。是(),我无事喜欢上街游荡。是() 否()否() 例例2 2,你对自己的工作满意吗?非常满意()比较满意(),你对自己的工作满意吗?非常满意()比较

189、满意() 无所无所谓()谓() 不大满意()不大满意() 极不满意()极不满意() 特点:特点: 一般采用调查表形式一般采用调查表形式 题目数量多题目数量多 在同一个测验中可以包含几个分量表在同一个测验中可以包含几个分量表 受测者在作答时是可能会出现反应心向,必须采取一定措施加以受测者在作答时是可能会出现反应心向,必须采取一定措施加以控制。控制。2082、几种自陈量表 (1 1)卡特尔十六种人格因素测验()卡特尔十六种人格因素测验(16PF16PF) 十六种人格因素问卷是美国伊利诺州立大学人格及能力测验研究十六种人格因素问卷是美国伊利诺州立大学人格及能力测验研究所卡特尔教授编制的,所卡特尔教授

190、编制的,19791979年介绍我国,现在普遍用于测量人格年介绍我国,现在普遍用于测量人格特征。特征。 本测验所依据的理论,是卡特尔的特质理论。他认为人的个性是本测验所依据的理论,是卡特尔的特质理论。他认为人的个性是由许多特质所构成。它们是:乐群性(由许多特质所构成。它们是:乐群性(A A)、聪慧性()、聪慧性(B B)、稳定)、稳定性(性(C C)、恃强性()、恃强性(E E)、兴奋性()、兴奋性(F F)、有恒性()、有恒性(G G)、敢为性)、敢为性(H H)、敏感性()、敏感性(I I)、怀疑性()、怀疑性(L L)、幻想性()、幻想性(M M)、世故性()、世故性(N N)、)、忧虑性

191、(忧虑性(O O)、实验性()、实验性(Q1Q1)、独立性()、独立性(Q2Q2)、自律性()、自律性(Q3Q3)紧张)紧张性(性(Q4Q4)。由这些因素的不同组合,就构成一个人不同于其他人)。由这些因素的不同组合,就构成一个人不同于其他人的独特个性。还能根据实验统计结果所得的公式,用有关量表的的独特个性。还能根据实验统计结果所得的公式,用有关量表的标准分数算出四种次级人格因素,如:适应性与焦虑性、内向与标准分数算出四种次级人格因素,如:适应性与焦虑性、内向与外向性、感情用事与安祥机警性、怯懦与果断性等。还可以根据外向性、感情用事与安祥机警性、怯懦与果断性等。还可以根据前面的测验分数(标准分)

192、进行运算,了解心理健康情况是否会前面的测验分数(标准分)进行运算,了解心理健康情况是否会有成就、适应环境的能力、创造力等。有成就、适应环境的能力、创造力等。209(2)明尼苏达多相人格问卷(MMPI) 明尼苏达多相人格测验是美国明尼苏达大学教授郝兹明尼苏达多相人格测验是美国明尼苏达大学教授郝兹威与莫金利于威与莫金利于2020世纪世纪4040年代初期编制的。该测验在人年代初期编制的。该测验在人格鉴定、心理疾病的诊断治疗、心理咨询以及人类学、格鉴定、心理疾病的诊断治疗、心理咨询以及人类学、心理学、医学的研究工作中有着广泛的应用,该测验心理学、医学的研究工作中有着广泛的应用,该测验的问世,是自陈量表

193、人格测验发展史上的一个重要的的问世,是自陈量表人格测验发展史上的一个重要的里程碑,对人格测量的研究进程产生了巨大的影响。里程碑,对人格测量的研究进程产生了巨大的影响。 MMPIMMPI的主要功能是检查个体的人格特点,判断精神病的主要功能是检查个体的人格特点,判断精神病患者和正常者。患者和正常者。MMPIMMPI共有共有566566个项目,其中个项目,其中1616个为重复个为重复题(主要用于检验反应的一致性,看作答是否认真),题(主要用于检验反应的一致性,看作答是否认真),实际上只有实际上只有550550题,题目内容范围很广,包括身体各方题,题目内容范围很广,包括身体各方面的情况、精神状态以及对

194、家庭、婚姻、宗教、政治、面的情况、精神状态以及对家庭、婚姻、宗教、政治、法律、社会等问题的态度等法律、社会等问题的态度等2626类问题。类问题。210(3)艾森克人格问卷(EPQ) 艾森克人格问卷是由英国艾森克教授和夫人共同编制艾森克人格问卷是由英国艾森克教授和夫人共同编制而成。目前在我国广泛使用的艾森克人格问卷有多种而成。目前在我国广泛使用的艾森克人格问卷有多种版本,都具有较好的信度和效度。版本,都具有较好的信度和效度。 艾森克也是特质理论的代表人物之一。他在收集了大艾森克也是特质理论的代表人物之一。他在收集了大量有关人的非认知方面资料的基础上,通过因素分析,量有关人的非认知方面资料的基础上

195、,通过因素分析,提出了三纬度人格理论,即内外倾向、情绪稳定性和提出了三纬度人格理论,即内外倾向、情绪稳定性和心理变态倾向。一个人在这三个纬度上的不同程度的心理变态倾向。一个人在这三个纬度上的不同程度的倾向性,便构成了一个人的人格特征。以此为依据,倾向性,便构成了一个人的人格特征。以此为依据,通过大量实验,编制了数个个性调查表,在实验取得通过大量实验,编制了数个个性调查表,在实验取得大量实证资料的基础上,编制成人格问卷。他有两种大量实证资料的基础上,编制成人格问卷。他有两种格式,分别供成人和青少年使用。这两种格式均由四格式,分别供成人和青少年使用。这两种格式均由四个分量表组成:一是内外向量表(个

196、分量表组成:一是内外向量表(E E);二是情绪稳定);二是情绪稳定性量表(性量表(N N);三是病理人格量表();三是病理人格量表(P P);四是效度量);四是效度量表(表(L L)。)。211(4)加州心理问卷(CPI)加州心理问卷是由高夫在MMPI的基础上编制而成的。该测验一半题目来自MMPI,另一半反映正常青少年和成人的人格。该量表不同于MMPI的地方是更强调正常的人格,因而也是常用人格问卷之一。该问卷由480个题目组成,分为18个量表,其中3个为效度量表。212(四)投射测验投射技术也是人格测量中的一种常见方法。投射测验通过向被试者提供一些未经组织的刺激情境,让被试在不受限制的情境下自

197、由地表现出他的反应,分析反应结果,以推断其人格情况。目前常见的投射测验有:1、罗夏墨迹测验2、主题统觉测验(TAT)213(五)评定量表和情景测验 1 1、人格评定量表、人格评定量表 在心理测量方法中,评定量表是用来量化观察中所得印象的一种在心理测量方法中,评定量表是用来量化观察中所得印象的一种测量工具。人格评定量表就是通过观察,给人的某种行为或人格测量工具。人格评定量表就是通过观察,给人的某种行为或人格特性确定一个分数(通常为等级)的标准化程序。特性确定一个分数(通常为等级)的标准化程序。 由于评量方式不同,评定量表有多种形式,如:由于评量方式不同,评定量表有多种形式,如: (1 1)数字评

198、定量表)数字评定量表 在数字评定量表中,评定者根据被评定的在数字评定量表中,评定者根据被评定的某种属性(例如领导能力、人际交往有效性等)在被试身上的表某种属性(例如领导能力、人际交往有效性等)在被试身上的表现作出判断并分派给数字值。现作出判断并分派给数字值。 (2 2)图表评定量表)图表评定量表 要求评定人在一个描述某种行为或特质的要求评定人在一个描述某种行为或特质的维量上选择一个合适的位置来反映被评定者具有这种行为或特质维量上选择一个合适的位置来反映被评定者具有这种行为或特质的程度。的程度。 (3 3)标准评定量表)标准评定量表 评定者将被试与标准进行比较,从而获得评定者将被试与标准进行比较

199、,从而获得某种特质的估计。某种特质的估计。 (4 4)强迫选择评定量表)强迫选择评定量表 在这类量表中,每道题目有两个在社在这类量表中,每道题目有两个在社会赞许性上等值的句子,要求评定者标出与被评定者最为相似和会赞许性上等值的句子,要求评定者标出与被评定者最为相似和最不相似的句子。最不相似的句子。2142、情境测验情境测验是指预先布置一种情境,主试观察被试在此情境中的行为表现,从而判定其人格。由于有意设计和控制了情境,可以认为情境测验是一种特殊的实验观察,亦即一种清净实验。用于测验人格的情境,不外“实际生活情境”与“设计的情境”。前者多用于教育上,如品格教育测验;后者多用于特殊人员的选拔,如情

200、境压力测验。215六、学生个体发展综合评价 学生个体发展综合评价包括思想品德、学力、体质、学生个体发展综合评价包括思想品德、学力、体质、审美、劳动技能等五个方面发展质量的评价。审美、劳动技能等五个方面发展质量的评价。 学学 生生 学生个体品德发展水平学生个体品德发展水平 个个 学生个体学力发展水平学生个体学力发展水平 体体 学生个体体质发展水平学生个体体质发展水平 发发 学生个体审美发展水平学生个体审美发展水平 展展 学生个体劳动技能发展水平学生个体劳动技能发展水平 质质 量量216学生个体思想品德测评 学学 思想品德课思想品德课成绩成绩 生生 思想品德观念思想品德观念 个个 掌握小学德掌握小

201、学德育大纲要求内容情况育大纲要求内容情况 体体 爱爱祖国祖国 思思 爱爱集体集体 想想 思想品德表现行为思想品德表现行为 守纪律守纪律 品品 文文明礼貌明礼貌 德德 道德品质道德品质217学生学力发展水平测评学学 语文成绩语文成绩生生 数学成绩数学成绩学学 学业成绩学业成绩 自然成绩自然成绩力力 地理成绩地理成绩发发展展 学习能力学习能力水水 基本能力基本能力 创造能力创造能力平平 动手能力动手能力218学生个体体质发展测评学 体育、卫生常识生 两操活动情况个体 身体形态与技能体质 身体素质与运动能力发 个人卫生习惯展 卫生习惯 环境卫生习惯219学生个体审美水平测评 学学 音乐课成绩音乐课成

202、绩 生生 审美知识水平审美知识水平 个个 美术课成美术课成绩绩 体体 辨别自然辨别自然美的能力美的能力 审审 感受美的能力感受美的能力 美美 辨别思想、辨别思想、言行美丑的能力言行美丑的能力 发发 展展 仪表美仪表美 水水 美的表现美的表现 语言美语言美 平平 行为美行为美220学生个体劳动技能发展水平测评学生 自我服务劳动技能个体 家务劳动技能劳动 生产劳动基础技能技能221第九章 教学评价教学评价是整个学校教育评价的一个重要方面,教学评价是整个学校教育评价的一个重要方面,是构成全面的教育评价的中心和基础。研究和是构成全面的教育评价的中心和基础。研究和了解有关教学评价的问题与方法对指导教师的

203、了解有关教学评价的问题与方法对指导教师的教学、提高教学质量有着重大的理论意义和实教学、提高教学质量有着重大的理论意义和实践意义。践意义。一、教学评价的含义与作用一、教学评价的含义与作用教学评价是指根据一定的教学目的和标准,对教学评价是指根据一定的教学目的和标准,对教师的教和学生的学进行系统检测,并评定其教师的教和学生的学进行系统检测,并评定其价值及优缺点以求改进的过程。它是教学过程价值及优缺点以求改进的过程。它是教学过程的有机组成部分,亦是所有成功教学的基础。的有机组成部分,亦是所有成功教学的基础。这种教学评价的作用主要表现为以下几方面。这种教学评价的作用主要表现为以下几方面。222作用1、诊

204、断教学问题,提供教学质量评价本身并不是目的,提高和改进才是评价的根本目的,正如斯塔弗尔比姆强调的“评价最重要的目的不是证明,而是改进”。诊断学生整体存在的学习问题;诊断学生个体存在的学习问题;诊断教师教学自身存在的问题。223 2 2、促进学生的全面发展,提高学生的文化素质、促进学生的全面发展,提高学生的文化素质 教学评价能为学生提供一种学习的反馈信息。通过教学评价能为学生提供一种学习的反馈信息。通过“教学评定量教学评定量表表”,学生能够清楚地看到自己在学习中的表现情况。如自己在,学生能够清楚地看到自己在学习中的表现情况。如自己在班级或年级的位置,其学习状态与教学目标的距离,学习的发展班级或年

205、级的位置,其学习状态与教学目标的距离,学习的发展趋势与存在的问题、原因,学习能力与个性品质的发展情况,等趋势与存在的问题、原因,学习能力与个性品质的发展情况,等等。等。 3 3、实现教学管理的科学化、实现教学管理的科学化 学校教学工作目标的实现与教学质量管理水平高低的质量都必须学校教学工作目标的实现与教学质量管理水平高低的质量都必须借助教学评价这把借助教学评价这把“尺子尺子”来进行质量与判断。来进行质量与判断。 例如:通过教学评价,可以对教师的教学水平进行排队,使领导例如:通过教学评价,可以对教师的教学水平进行排队,使领导及有关部门及时掌握教师的教学动态,从而合理地安排教师的工及有关部门及时掌

206、握教师的教学动态,从而合理地安排教师的工作任务、进修方向,以提高教学质量和师资水平。作任务、进修方向,以提高教学质量和师资水平。 又如:通过教学评价,能为学校调整、提职、晋级和奖励教师提又如:通过教学评价,能为学校调整、提职、晋级和奖励教师提供可靠的第一手材料。供可靠的第一手材料。 4 4、为选拔各类人才提供客观依据、为选拔各类人才提供客观依据 5 5、促进学校教学研究活动的开展、促进学校教学研究活动的开展224二、影响教学质量的变量分析 在教学工作中,哪些变量影响着质量?哪些是主要变量?这些问题是确在教学工作中,哪些变量影响着质量?哪些是主要变量?这些问题是确定教学评价指标体系的关键问题。许

207、多教学评价的成效甚少,甚至失败,定教学评价指标体系的关键问题。许多教学评价的成效甚少,甚至失败,其根本原因之一就在于缺乏对影响教学质量的变量作一个系统、深入的其根本原因之一就在于缺乏对影响教学质量的变量作一个系统、深入的分析。分析。 (一)影响教学质量的变量(一)影响教学质量的变量 1 1、成效变量、成效变量 成效变量包括效果和效率两个主要变量。成效变量包括效果和效率两个主要变量。 效果主要反映在学生身上,即主要反映为学生的基础知识和基本技能掌效果主要反映在学生身上,即主要反映为学生的基础知识和基本技能掌握的情况,智能发展情况,思想品德的形成情况,性格发展情况,体质握的情况,智能发展情况,思想

208、品德的形成情况,性格发展情况,体质发展情况及审美力发展等情况。发展情况及审美力发展等情况。 对效果变量的考察与衡量,产生两大问题:一是无法把握产生效果的过对效果变量的考察与衡量,产生两大问题:一是无法把握产生效果的过程或原因,导致为追求效果而不择手段的后果;二是容易产生不考虑或程或原因,导致为追求效果而不择手段的后果;二是容易产生不考虑或很少考虑整体的综合效果,而是只强调整体效果的某一方面,如升学率。很少考虑整体的综合效果,而是只强调整体效果的某一方面,如升学率。 效率变量是教学质量的一个重要变量,在测评中不容忽视。如对教师来效率变量是教学质量的一个重要变量,在测评中不容忽视。如对教师来说,在

209、最短时间内教给学生尽可能多的东西,并能使尽可能多的学生获说,在最短时间内教给学生尽可能多的东西,并能使尽可能多的学生获得尽可能大的发展,这就是对教师教学工作效率的要求。得尽可能大的发展,这就是对教师教学工作效率的要求。 效果与效率不同,效果变量要求的是绝对成果;而效率变量要求的则是效果与效率不同,效果变量要求的是绝对成果;而效率变量要求的则是相对成果。相对成果。 在效果中看到效率,在效率中重视效果,实现效果与效率并重。在效果中看到效率,在效率中重视效果,实现效果与效率并重。2252、职责变量职责变量是反映教师教学工作中承担责任或完职责变量是反映教师教学工作中承担责任或完成任务情况的变量。成任务

210、情况的变量。衡量职责变量的问题:衡量职责变量的问题:第一,履行职责是达到目标、取得良好效果的第一,履行职责是达到目标、取得良好效果的重要条件,但在处理职责变量形式与效果的关重要条件,但在处理职责变量形式与效果的关系时,很容易产生只注重形式而不重视效果的系时,很容易产生只注重形式而不重视效果的偏向,应注意克服;偏向,应注意克服;第二,运用职责变量进行教学测评时比较容易第二,运用职责变量进行教学测评时比较容易出现的问题是职责不清或对职责要求不当,应出现的问题是职责不清或对职责要求不当,应当避免。当避免。2263、素质变量素质变量是反映教师完成教学工作应具备的素素质变量是反映教师完成教学工作应具备的

211、素质或自身条件的变量。教师的素质变量包括:质或自身条件的变量。教师的素质变量包括:政治觉悟政治觉悟师德师德知识水平知识水平教育、教学的智能(敏锐、准确的观察力、较教育、教学的智能(敏锐、准确的观察力、较强的表达能力、进行创造性工作的能力、实验强的表达能力、进行创造性工作的能力、实验能力和实际操作能力、教学和教育工作能力)能力和实际操作能力、教学和教育工作能力)身心状况身心状况227 成效变量、职责变量及素质变量是教学质量测评的三成效变量、职责变量及素质变量是教学质量测评的三种基本变量,缺一不可。种基本变量,缺一不可。 素质变量是影响教学质量的静态变量,是教师教学工素质变量是影响教学质量的静态变

212、量,是教师教学工作质量的必要条件变量,没有良好的素质,不可能有作质量的必要条件变量,没有良好的素质,不可能有良好的教学质量。良好的教学质量。 职责变量是影响教学质量的动态变量,如果没有良好职责变量是影响教学质量的动态变量,如果没有良好地履行职责的行为,素质再高,教师同样不可能有良地履行职责的行为,素质再高,教师同样不可能有良好的教学质量。好的教学质量。 成效变量是职责变量与素质变量共同作用的反映,但成效变量是职责变量与素质变量共同作用的反映,但不仅仅是上述两种变量的反映,除了这两种变量的影不仅仅是上述两种变量的反映,除了这两种变量的影响外,还有其它变量影响和制约着成效的优劣。响外,还有其它变量

213、影响和制约着成效的优劣。 因此,测评教学质量,仅看成效变量,不看职责与素因此,测评教学质量,仅看成效变量,不看职责与素质变量不行,反过来,仅看职责与素质变量,不看成质变量不行,反过来,仅看职责与素质变量,不看成效变量也不行,三种变量缺一不可。效变量也不行,三种变量缺一不可。228(二)影响教学测评指标内容与结构 热爱学生,热爱学生,平等对待学生平等对待学生 师德师德 遵纪守法,举止遵纪守法,举止文明,为人师表文明,为人师表 教教 努力使学生全努力使学生全面发展面发展 治学态度治学态度 教育思想教育思想 面向全体学生面向全体学生 师师 与教风与教风 治学态度治学态度 备课、讲课、批改作业、课外备

214、课、讲课、批改作业、课外辅导认真辅导认真 善于与有善于与有关教师协调一致开展教学活动关教师协调一致开展教学活动 教教 团结进取团结进取 在教学改革中,勇于在教学改革中,勇于开拓创新开拓创新 课堂教学课堂教学与改革与改革 学学 教学能力教学能力 教学研究教学研究 工作能力工作能力 教学测评教学测评 工工 组织辅导学组织辅导学生课外活动能力生课外活动能力 指导培养指导培养 指导和培养教师的指导和培养教师的能力能力 作作 思想品德思想品德 学生态度学生态度 知识能力知识能力 水水 工作成绩工作成绩 特长发展特长发展 教学研究与教学研究与 平平 科研成果科研成果 论文、实验、报告、论文、实验、报告、经

215、验、总结经验、总结229三、教学测评应注意的问题 1 1、关于教学工作量与质的关系问题、关于教学工作量与质的关系问题 量是指教学工作中所付出的劳动量;质是指教师完成量是指教学工作中所付出的劳动量;质是指教师完成教学工作的好坏或优劣程度。教学工作的好坏或优劣程度。 应将两者统一起来,不要孤立地只看某一方面。应将两者统一起来,不要孤立地只看某一方面。 2 2、关于他评与自评的关系问题、关于他评与自评的关系问题 3 3、关于教学测评再评价问题、关于教学测评再评价问题 教学测评的过程是一个循环往复的过程。评价不能一教学测评的过程是一个循环往复的过程。评价不能一次定终身,而是为保证教学工作评价的客观性和

216、有效次定终身,而是为保证教学工作评价的客观性和有效性,必须对教学评价进行再评价。如果不对教学工作性,必须对教学评价进行再评价。如果不对教学工作评价进行再评价,便运用评价结果去决策,将冒决策评价进行再评价,便运用评价结果去决策,将冒决策失误的很大风险。失误的很大风险。230四、教学评价的宏观依据依据教育方针和政策法规依据教学大纲和教科书依据教学规律与教学原则依据学生身心发展规律参考新的思想观念231新的人才观 新型的人才应具备自主、积极进取和创新精神,敢于新型的人才应具备自主、积极进取和创新精神,敢于迎接挑战而不是保守和退缩。迎接挑战而不是保守和退缩。 新型的人才要有较强的适应能力和应变能力。新

217、型的人才要有较强的适应能力和应变能力。 新型的人才要有高度的工作责任感和时代责任感,怒新型的人才要有高度的工作责任感和时代责任感,怒有高度的奉献精神和高尚的道德品质。有高度的奉献精神和高尚的道德品质。 新型的人才应具有丰富的个性,更加注重发展非智力新型的人才应具有丰富的个性,更加注重发展非智力因素。因素。 新型的人才应更加善于学习,具有独立获取知识的能新型的人才应更加善于学习,具有独立获取知识的能力,善于力,善于“学会生存学会生存”。 新型的人才应是德智体美劳全面和谐发展的人才。新型的人才应是德智体美劳全面和谐发展的人才。232新的知识观新时期追求多元化的知识,多种文化的特点的求知方式。追求知

218、识更高的整体性、综合性。233新的学习观传统教育重视社会和教育者对学生学习知识的选择,新的学习观则重视学生自己对学习知识的选择。新的学习观更加重视学生学习的主动性、积极性、创造性。学习应着重培养各种应付未来的能力。234新的学生素质观思想品德素养(学会做人、求善)文化科学素养(学会学习、创造、求真)身体和心理素养(学会生活,心强体键)审美艺术素养(学会审美、求美)劳动准备素养(学会劳动、敬业)235新的教师素质观 未来的教师应该具有运用自己的知识和能力为更高的社会目标服务的价未来的教师应该具有运用自己的知识和能力为更高的社会目标服务的价值观。值观。 未来的教师应该是学识渊博和见解深刻的人,他应

219、具有广广博知识,了未来的教师应该是学识渊博和见解深刻的人,他应具有广广博知识,了解各种自然和社会系统运转的规律,懂得这些知识的来龙去脉,懂得如解各种自然和社会系统运转的规律,懂得这些知识的来龙去脉,懂得如何运用基本方法和这些方法能够凑效的原因。何运用基本方法和这些方法能够凑效的原因。 未来教师应该具有继续学习的要求、能力和习惯。未来教师应该具有继续学习的要求、能力和习惯。 未来教师应该能够独立思考、有创造性,能够独立工作,也能够与他人未来教师应该能够独立思考、有创造性,能够独立工作,也能够与他人合作,能够对事情作出关键性的判断,能够把独立思考、创造的精神与合作,能够对事情作出关键性的判断,能够

220、把独立思考、创造的精神与开放、合作的态度结合起来。开放、合作的态度结合起来。 违碍里的教师应该具有激发学生努力学习的热情和积极性,能够创造一违碍里的教师应该具有激发学生努力学习的热情和积极性,能够创造一种气氛和环境,使学生不仅获得学习的乐趣,而且能为他们以后的继续种气氛和环境,使学生不仅获得学习的乐趣,而且能为他们以后的继续学习打下基础,能够运用获得的知识去创造未来的生活。学习打下基础,能够运用获得的知识去创造未来的生活。 未来的教师应该愿意并且善于和自己的学生接触、对话、交流。未来的教师应该愿意并且善于和自己的学生接触、对话、交流。 未来的教师应该对变革充满热情,把握方向,选择道路,把变革和

221、创新、未来的教师应该对变革充满热情,把握方向,选择道路,把变革和创新、继承和发展、原则性和灵活性等恰当地结合起来。继承和发展、原则性和灵活性等恰当地结合起来。236五、五、 建立新课程理念下的课堂教学评价体系建立新课程理念下的课堂教学评价体系运用新课程理念运用新课程理念“以人为本以人为本”、“全面发展,全面发展,培养创新人才培养创新人才”进行课堂教学已成为实施新课程进行课堂教学已成为实施新课程的核心内容之一,也成为广大教师关心的热点。的核心内容之一,也成为广大教师关心的热点。课堂教学评价评价的目的是全面考察学生的学习课堂教学评价评价的目的是全面考察学生的学习状况,激励学生的学习热情,促进学生的

222、全面发状况,激励学生的学习热情,促进学生的全面发展。评价也是教师反思和改进教学的有力手段。展。评价也是教师反思和改进教学的有力手段。课堂教学评价要遵循有关评价的课堂教学评价要遵循有关评价的“了解、激励、了解、激励、促促 进、反思进、反思”的八字方针。的八字方针。237教学评价的对象不是教师本身,而是课堂教学。具体地说,是教师与学生在课堂课堂上的活动及效果。旧的课堂教学评价理念与体系(即“以教师为中心”,忽视学生的学习过程,对学生潜能、智慧的培养)已不再适应新课程的课堂教学要求。要用新课程理念下的课堂教学评价标准来规范教师的教学行为,促进学生学习方式的改变,真正形成一个生动、活泼、主动的课堂教学

223、新局面!238一、建立新课程理念下的课堂教学评价体系的指导思想 1 1新的课堂教学评价标准要体现新课程对新的课堂教学评价标准要体现新课程对“教学教学”本质的诠释本质的诠释教学从本质说是一种有目的、有计划、有组织的教学从本质说是一种有目的、有计划、有组织的“沟通沟通”与对话活动。我们应把课堂教学看作是教与对话活动。我们应把课堂教学看作是教师与学生互动、互相交流的过程。师与学生互动、互相交流的过程。“教与学的关系表现为特定条件下教育者与受教教与学的关系表现为特定条件下教育者与受教育者的行为关系,表现力教育者与受教育者所形成育者的行为关系,表现力教育者与受教育者所形成的各种关系中的社会互动关系,即两

224、者各自的主体的各种关系中的社会互动关系,即两者各自的主体关系。关系。”教师是教的主体,学生是学的主体,并且教师这一教师是教的主体,学生是学的主体,并且教师这一主体服从于、服务于学生这个主体。主体服从于、服务于学生这个主体。239教师是教的主体,学生是学的主体,并且教师这一主教师是教的主体,学生是学的主体,并且教师这一主体服从于、服务于学生这个主体。体服从于、服务于学生这个主体。说得更具体一点,教师的教要符合学生的发展的需要,说得更具体一点,教师的教要符合学生的发展的需要,适合学生的认知水平。适合学生的认知水平。评价课堂教学时,既要考虑教师教的一面,又要考评价课堂教学时,既要考虑教师教的一面,又

225、要考虑学生学的一面,而重点是看学生是否学会学习,是虑学生学的一面,而重点是看学生是否学会学习,是否掌握了学习技巧。否掌握了学习技巧。240要体现新课程的要体现新课程的“以学生发展为本以学生发展为本”这一这一核心理念核心理念教育的根本目的是为了学生的发展,课堂教学也教育的根本目的是为了学生的发展,课堂教学也不例外。因此,关注学生在课堂教学中的表现应是不例外。因此,关注学生在课堂教学中的表现应是课堂教学评价的主要内容,包括自主学习、师生互课堂教学评价的主要内容,包括自主学习、师生互助、同伴互助中的行为表现、参与热情、情感体验助、同伴互助中的行为表现、参与热情、情感体验和探究、思考的过程等等。和探究

226、、思考的过程等等。 确定课堂教学评价体系,要从学生全面发展的需确定课堂教学评价体系,要从学生全面发展的需要出发,不仅要关注学生的知识与技能,更要注重要出发,不仅要关注学生的知识与技能,更要注重学生的学习状态和情感体验,注重教学过程中学生学生的学习状态和情感体验,注重教学过程中学生主体地位的体现和主体作用的发挥,强调尊重学生主体地位的体现和主体作用的发挥,强调尊重学生人格和个性,鼓励发现、探究与质疑以利于培养学人格和个性,鼓励发现、探究与质疑以利于培养学生的创新精神和实践能力。生的创新精神和实践能力。2413.3.3.3.坚持坚持坚持坚持“评教评教评教评教”与与与与“评学评学评学评学”相结合相结

227、合相结合相结合, , , ,侧重侧重侧重侧重“评学评学评学评学” 课堂教学是教师组织和引导学生进行有效学习的过程,课堂教学是教师组织和引导学生进行有效学习的过程,是师生互动、生生互动共同实现具体发展目标的过程。是师生互动、生生互动共同实现具体发展目标的过程。 传统的课堂教学评价是以教师的教来评价学生的学,即谓传统的课堂教学评价是以教师的教来评价学生的学,即谓“以教论学以教论学”。这种评价的基点是以教师为中心,仅关注教。这种评价的基点是以教师为中心,仅关注教师在课堂上的教学行为表现,忽视了学生参与学习的过程。师在课堂上的教学行为表现,忽视了学生参与学习的过程。现在,我们把教学活动的关注重点从教师

228、传授知识转移到学现在,我们把教学活动的关注重点从教师传授知识转移到学生有效活动之后,课堂教学评价也应由原来的生有效活动之后,课堂教学评价也应由原来的“以教论学以教论学”转变为转变为“以学论教以学论教”。 “ “评学评学”将以课堂教学中学生的参与度来衡量。学生参与将以课堂教学中学生的参与度来衡量。学生参与度是判断学生主体地位是否落实和学生主体性发挥的主要指度是判断学生主体地位是否落实和学生主体性发挥的主要指标。优质的课堂教学概念是让学生动脑思考、动口表述、动标。优质的课堂教学概念是让学生动脑思考、动口表述、动手操作,让每个学生都有学习经历的体验、都达到了学习目手操作,让每个学生都有学习经历的体验

229、、都达到了学习目的和教学要求。的和教学要求。242如果学生原意学习并积极投入学习,将获得最佳学习如果学生原意学习并积极投入学习,将获得最佳学习效果。效果。有如下一个实例:日本研究者龟口蕙治将学生学习方式和记忆效果作了一些比较,结果如下:教师满堂灌,学生只能记住;学生自己阅读能记住;使用图象,学生能记住;演示试验,学生能记住;课后讨论,学生能记住;演讲后,让学生练习,学生可以记住;而学生互教、互学、在做中学,能记住。243 新的课堂教学评价要以评学为突破口,以此来促新的课堂教学评价要以评学为突破口,以此来促进教师更新教学观念,转变教学行为,真正达到改进教师更新教学观念,转变教学行为,真正达到改造

230、课堂,改进教学的目的。造课堂,改进教学的目的。体现开放性体现开放性确定课堂教学评价体系既要体现课堂教学的一般确定课堂教学评价体系既要体现课堂教学的一般特性,又要为不同学科和不同条件的课堂教学留有特性,又要为不同学科和不同条件的课堂教学留有可变通的余地。提倡创新,鼓励个性化教学。例如可变通的余地。提倡创新,鼓励个性化教学。例如理、化、生等实验性学科,可把学生的操作情况作理、化、生等实验性学科,可把学生的操作情况作为评价的一个方面。为评价的一个方面。244坚持可行性坚持可行性可行性是实施评价的前提。可行性是实施评价的前提。课堂教学评价体系要符合当前课堂的改革的实际,课堂教学评价体系要符合当前课堂的

231、改革的实际,评价标准是期待实现的目标,但又必须是目前条件评价标准是期待实现的目标,但又必须是目前条件下能达到的,这样,以利于发挥评价的激励功能。下能达到的,这样,以利于发挥评价的激励功能。评价要点必须是可观察、可感受、可测量的,便评价要点必须是可观察、可感受、可测量的,便于评价者进行判断。于评价者进行判断。评价办法要注重质性评价和综合判断,力求简单,评价办法要注重质性评价和综合判断,力求简单,易于操作。易于操作。245二、新的课堂教学评价的取向二、新的课堂教学评价的取向 (一)教学评价新取向之一(一)教学评价新取向之一多元化多元化 教学评价的多元化可根植于美国心理学家加德纳的多教学评价的多元化

232、可根植于美国心理学家加德纳的多元智力理论。基于这一思想,教学评价应体现多元化元智力理论。基于这一思想,教学评价应体现多元化特征,否则难以确切落实。具体而言,表现为:特征,否则难以确切落实。具体而言,表现为: 教学评价标准的多元化教学评价标准的多元化 教学评价对象的多元化教学评价对象的多元化 教学评价方法的多元化教学评价方法的多元化 教学评价形式的多元化教学评价形式的多元化 教学评价新取向之多元化,由于其间要素众多,必须教学评价新取向之多元化,由于其间要素众多,必须协调各成分的关系,使其能相互交融,互为所用,而协调各成分的关系,使其能相互交融,互为所用,而不至于会混淆、冲突。不至于会混淆、冲突。

233、246(二)教学评价新取向之二(二)教学评价新取向之二发展性发展性 发展性教学评价的本质特征是在聚焦个体发展的基础上谋求内部发展性教学评价的本质特征是在聚焦个体发展的基础上谋求内部机制的发展。机制的发展。 1 1、在聚焦个体的发展上:、在聚焦个体的发展上: 第一,发展的内涵指个性的自由发展,个性指个体生理与心理上第一,发展的内涵指个性的自由发展,个性指个体生理与心理上的各方面,包括个人与过去和现实的联系、价值、情感、需要和的各方面,包括个人与过去和现实的联系、价值、情感、需要和信念等。信念等。 第二,发展的外延是指人的全面发展,即个体在成长过程中逐步第二,发展的外延是指人的全面发展,即个体在成

234、长过程中逐步趋向社会化。趋向社会化。 第三,个体的发展除了针对学生,教师自身更应在发展中求进取、第三,个体的发展除了针对学生,教师自身更应在发展中求进取、求生存。求生存。 2 2、谋求内部机制的发展方面:、谋求内部机制的发展方面: 教学评价随着时间的迁移、空间的变换,将不断调整自身的体系、教学评价随着时间的迁移、空间的变换,将不断调整自身的体系、定位以适应新的更替。定位以适应新的更替。 小结:作为教学评价的新取向小结:作为教学评价的新取向在聚焦个体发展的基础上谋求在聚焦个体发展的基础上谋求内部机制的发展,这给评价以新的启迪。若以此为参照系,督促内部机制的发展,这给评价以新的启迪。若以此为参照系

235、,督促教学,可使教学本性之发展性得以回归。对发展而言,须警戒鱼教学,可使教学本性之发展性得以回归。对发展而言,须警戒鱼木混杂、不得要领,也就是应辩清什么特质是值得推广拓伸的,木混杂、不得要领,也就是应辩清什么特质是值得推广拓伸的,以实现真正意义上的发展。以实现真正意义上的发展。247(三)教学评价新取向之三(三)教学评价新取向之三以人为本以人为本 传统的教学和教学评价总是以教师为中心,抹煞学生传统的教学和教学评价总是以教师为中心,抹煞学生的自主能动性。而教学评价新取向中的的自主能动性。而教学评价新取向中的“以人为本以人为本”,主要涉及的是以学生为本。,主要涉及的是以学生为本。 以学生为本其内涵

236、是教师信任学生具有建构同化知识以学生为本其内涵是教师信任学生具有建构同化知识的能力;尊重学生智力潜能差异;理解学生情感态度的能力;尊重学生智力潜能差异;理解学生情感态度体验。体验。 以教师为本内涵:了解教师对教学内容的解读、对教以教师为本内涵:了解教师对教学内容的解读、对教学环节的构思、尊重其独特有效的教学风格,切忌使学环节的构思、尊重其独特有效的教学风格,切忌使教学模式千篇一律;以教师需求与发展为本。教学模式千篇一律;以教师需求与发展为本。 教学评价新取向之以人为本,评价人员应深刻理解其教学评价新取向之以人为本,评价人员应深刻理解其涵义,衡量测评时对其上、下阙限以及临界点的把握涵义,衡量测评

237、时对其上、下阙限以及临界点的把握要合理,从而能做到要合理,从而能做到“心中有学生,以学生为中心心中有学生,以学生为中心”。248(四)教学评价新取向之四(四)教学评价新取向之四艺术性艺术性教学评价是融科学性和艺术性为一体的活动。教学评价是融科学性和艺术性为一体的活动。将艺术性列为教学评价的新取向:其一,借鉴将艺术性列为教学评价的新取向:其一,借鉴的是美国教育评价研究者艾斯纳提出的艺术鉴的是美国教育评价研究者艾斯纳提出的艺术鉴赏评价思想;其二,作为教学评价的载体,教赏评价思想;其二,作为教学评价的载体,教学本身有很强的艺术性,从艺术的角度去品味学本身有很强的艺术性,从艺术的角度去品味存在合理性。

238、存在合理性。教学评价的新取向之艺术性,应是评价操作中教学评价的新取向之艺术性,应是评价操作中的难点之一,必须明确的是艺术性绝不能有悖的难点之一,必须明确的是艺术性绝不能有悖于评价的科学性,否则适得其反。于评价的科学性,否则适得其反。如何把握教学评价艺术性的尺度?如何把握教学评价艺术性的尺度?249(五)教学评价新取向之五(五)教学评价新取向之五再检性再检性 教学评价对信息源的辨认是否准确,而其结果是否公正、客观、教学评价对信息源的辨认是否准确,而其结果是否公正、客观、有效,就此可为教学评价构建再评指标,而教学评价的再检性也有效,就此可为教学评价构建再评指标,而教学评价的再检性也就是在此意义上谈

239、及的。就是在此意义上谈及的。 注重再检性,可对教学评价中存在的疏漏、不足加以弥补;对评注重再检性,可对教学评价中存在的疏漏、不足加以弥补;对评价中出现的抵触、矛盾使之协同;对评价的流程、操作予以规范、价中出现的抵触、矛盾使之协同;对评价的流程、操作予以规范、监督。教学评价惟有在宏观调控的基础上才能最大限度的发挥自监督。教学评价惟有在宏观调控的基础上才能最大限度的发挥自身功效,鞭策教学水准提升。身功效,鞭策教学水准提升。 容易产生的错误:控制性太过严密,使评价的弹性机制遭到压制,容易产生的错误:控制性太过严密,使评价的弹性机制遭到压制,就会使评价工作举步维艰,不能属实反映教学的真实一面。就会使评

240、价工作举步维艰,不能属实反映教学的真实一面。 小结:教学评价的新取向能否行之有效,须谨慎对待每一项新的小结:教学评价的新取向能否行之有效,须谨慎对待每一项新的举措,重中之重依赖于对教学本性的认识,也只有明确教学本性,举措,重中之重依赖于对教学本性的认识,也只有明确教学本性,教学评价的功能才可突出体现。教学评价的功能才可突出体现。250三、新的课堂教学评价标准的基本要点三、新的课堂教学评价标准的基本要点三、新的课堂教学评价标准的基本要点三、新的课堂教学评价标准的基本要点新的评价标准中,共设置四个新的评价标准中,共设置四个“评价项目评价项目”,个,个“评价评价指标指标”(详见评价表)。(详见评价表

241、)。这四个评价项目分别是:教学目标、教师行为、学生活动和教这四个评价项目分别是:教学目标、教师行为、学生活动和教学效果。学效果。显然,它与旧的课堂教学评价体系有很大的差别。它不再单纯显然,它与旧的课堂教学评价体系有很大的差别。它不再单纯从教师教的一面考虑,而是,既考虑教师教的一面,又考虑学从教师教的一面考虑,而是,既考虑教师教的一面,又考虑学生学的一面。生学的一面。“评价指标评价指标”是对各个评价项目的进行评价的主要因素。这是对各个评价项目的进行评价的主要因素。这个评价指标分别是:个评价指标分别是:教学目标含有项指标:目标的确定和重难点的确定。教学目标含有项指标:目标的确定和重难点的确定。教师

242、行为含有项指标:教学环境的创设;学习资源教师行为含有项指标:教学环境的创设;学习资源的处理;学习指导的情况;教学策略的的运用;的处理;学习指导的情况;教学策略的的运用;教学过程的调控;教师素养。教学过程的调控;教师素养。251学生活动包含项指标:学生参与活动的态度;学生活动包含项指标:学生参与活动的态度;学生参与活动的广度;学生参与活动的深度;学生参与活动的广度;学生参与活动的深度;学生参与活动的宽松情况。学生参与活动的宽松情况。教学效果包含项指标:目标达成度;解决问教学效果包含项指标:目标达成度;解决问题情况;教师学生的精神状态;课堂气氛活跃题情况;教师学生的精神状态;课堂气氛活跃程度。程度

243、。“指标要点指标要点”是对评价指标所包含的具体内容及其特是对评价指标所包含的具体内容及其特征征的描述,它方便评课人评判。的描述,它方便评课人评判。从这些要点我们可以看到,评判一堂课不仅要从教师的从这些要点我们可以看到,评判一堂课不仅要从教师的行为方式、学生的学习方式及其教学效果来评,还要从行为方式、学生的学习方式及其教学效果来评,还要从教师、学生的情感、态度及其课堂气氛来进行评判。教师、学生的情感、态度及其课堂气氛来进行评判。252量化后的评价等第的具体划分为:总分在分以上为“优秀”;总分在分以上、分以下为“良好”;总分在分以上、分以下为“一般”;总分在分以下为“较差”。“指标达成度”是根据特

244、征描述,对教师所授的课与评价要点达成情况所作的判断。它设置三个等级:“达成”()、“基本达成”()和“未达成”()。为方便操作,我们给“指标达成度”的三个等级予以量化,即每一项指标的、三个等级给以一个量化分值。253 目标的确定目标的确定 新新 教学目标教学目标 重点难点的确定重点难点的确定 的的 教学环境的创设教学环境的创设 课课 学习资源的处理学习资源的处理 堂堂 教师行为教师行为 学习指导的情况学习指导的情况 教教 教学策略的运用教学策略的运用 学学 教学过程的调控教学过程的调控 评评 教师素养教师素养 价价 学生参与活动的态度学生参与活动的态度 指指 学生活动学生活动 学生参与活动的广

245、度学生参与活动的广度 标标 学生参与活动的深度学生参与活动的深度 体体 学生参与活动的宽松情况学生参与活动的宽松情况 系系 教学效果教学效果 目标达成度目标达成度 解决问题情况解决问题情况 教师学生的精神状态教师学生的精神状态 课堂气氛活跃程度课堂气氛活跃程度254第十章现代教育测量与评价的发展趋势 一、现代西方教育评价理论的主要派别一、现代西方教育评价理论的主要派别 1 1、行为目标模式、行为目标模式 行为目标模式是泰勒的理论,这一模式是教育评价领行为目标模式是泰勒的理论,这一模式是教育评价领域出现的最早的评价模式,至今,在众多的评价模式域出现的最早的评价模式,至今,在众多的评价模式中,它仍

246、是不可缺少的重要的评价模式,尤其是应用中,它仍是不可缺少的重要的评价模式,尤其是应用在对学生质量的评价活动中。在对学生质量的评价活动中。 行为目标模式是心理学中行为学派的产物,并由此得行为目标模式是心理学中行为学派的产物,并由此得名。它把教育方案、计划的目标用学生的特殊成就来名。它把教育方案、计划的目标用学生的特殊成就来表示,并把这一行为目标当作教育过程和教育评价的表示,并把这一行为目标当作教育过程和教育评价的主要依据。根据这一模式,教育评价就是判断实际活主要依据。根据这一模式,教育评价就是判断实际活动达到目标的程度。动达到目标的程度。 目标目标 评价评价 实施实施255 预定的目标决定了教育

247、活动,同时也规定了评价就是预定的目标决定了教育活动,同时也规定了评价就是找出实际活动偏离目标的程度,从而通过信息的反馈,找出实际活动偏离目标的程度,从而通过信息的反馈,促进实际工作能够尽可能地逼近目标。促进实际工作能够尽可能地逼近目标。 泰勒评价思想和评价方法的具体表达形式是泰勒评价思想和评价方法的具体表达形式是“泰勒原泰勒原则则”。 泰勒原则由四个步骤构成:泰勒原则由四个步骤构成:确定目标选择经验组织经验评价效果2562、CIPP模式 CIPPCIPP模式亦称决策类型模式,创立人是斯塔弗尔比姆。模式亦称决策类型模式,创立人是斯塔弗尔比姆。它是泰勒模式的发展,其中最主要的是目标的合理性它是泰勒

248、模式的发展,其中最主要的是目标的合理性和可行性受到了充分的重视,泰勒模式的缺陷在这里和可行性受到了充分的重视,泰勒模式的缺陷在这里得到了克服。得到了克服。 与泰勒模式比较,与泰勒模式比较,CIPPCIPP模式并不太多地集中在指导学模式并不太多地集中在指导学习的行为上,它更多地指向持续不断地为机构决策者习的行为上,它更多地指向持续不断地为机构决策者提供评价。因此,它的运用范围较泰勒模式也要广泛提供评价。因此,它的运用范围较泰勒模式也要广泛得多。其基本框架是:得多。其基本框架是:背景评价输入评价过程评价成果评价257 背景评价背景评价为计划决策服务为计划决策服务 最初意向是要确定某一客体的长处与不

249、足,从而为改进工作提供最初意向是要确定某一客体的长处与不足,从而为改进工作提供指导。指导。 输入评价输入评价为组织决策服务为组织决策服务 主要意向是要有助于制定方案的行为方针以产生所需的变革。即主要意向是要有助于制定方案的行为方针以产生所需的变革。即帮助委托人根据自己需要和周围环境来考察各种备择方案,并判帮助委托人根据自己需要和周围环境来考察各种备择方案,并判定相应的工作计划。定相应的工作计划。 过程评价过程评价为实施决策服务为实施决策服务 是对计划实施情况不断加以检查,包括实施方案的活动是否按计是对计划实施情况不断加以检查,包括实施方案的活动是否按计划的时间进行,执行情况怎样,是否有缺陷需要

250、改进,等等。过划的时间进行,执行情况怎样,是否有缺陷需要改进,等等。过程评价的主要用途是获得反馈。程评价的主要用途是获得反馈。 成果评价成果评价为再循环决策服务为再循环决策服务 目的是要测量、解释和判断方案的成就。其基本用途是要决定某目的是要测量、解释和判断方案的成就。其基本用途是要决定某一特定方案是否值得继续、重复和扩展到其它情境。它还为修改一特定方案是否值得继续、重复和扩展到其它情境。它还为修改芳案提供方向。芳案提供方向。2583、目的游离模式 是由斯克里芬提出的一种强调不受预定活动目的影响是由斯克里芬提出的一种强调不受预定活动目的影响的评价模式。的评价模式。 他认为,实际进行的教育活动除

251、了收到预期效应外,他认为,实际进行的教育活动除了收到预期效应外,还会产生各种还会产生各种“非预期效应非预期效应”,或者叫,或者叫“副效应副效应”。这种非预期效应的影响有时是很大的。这种非预期效应的影响有时是很大的。 根据预定教育目标进行评价,往往只注意目标规定的根据预定教育目标进行评价,往往只注意目标规定的预期效果,非预期效果很难得到反映。因此,为了降预期效果,非预期效果很难得到反映。因此,为了降低评价活动中方案、计划制定者主观意图的影响,不低评价活动中方案、计划制定者主观意图的影响,不能把方案制定者的预定的活动目的告诉评价者,以利能把方案制定者的预定的活动目的告诉评价者,以利于评价者收集全部

252、的关于方案的成果信息。于评价者收集全部的关于方案的成果信息。 它与泰勒模式和它与泰勒模式和CIPPCIPP模式的最大区别是:作出评价结模式的最大区别是:作出评价结论的依据、准绳不是制定者预定的目标,而是论的依据、准绳不是制定者预定的目标,而是“活动活动参与者参与者”的意图。也就是说,评价在研究对象时,不的意图。也就是说,评价在研究对象时,不带任何预定观念,通过观察与相互作用,目标就获得带任何预定观念,通过观察与相互作用,目标就获得了。因而它具有更大的了。因而它具有更大的“民主性民主性”。适用于实验评价。适用于实验评价。2594、对手模式 亦称反对模式。倡导人是列文,它是受司法工作的启亦称反对模

253、式。倡导人是列文,它是受司法工作的启示而产生的。示而产生的。 对手模式是为了揭示方案正反两方面长短得失,评价对手模式是为了揭示方案正反两方面长短得失,评价应该让持反对意见者参加,持肯定态度的评价者和持应该让持反对意见者参加,持肯定态度的评价者和持否定态度的评价者都提供证据,并确保问题正反两方否定态度的评价者都提供证据,并确保问题正反两方面的意见都能够提交到决策阶层。面的意见都能够提交到决策阶层。 对手模式十分重视听取教育方案和教育活动的争议意对手模式十分重视听取教育方案和教育活动的争议意见尤其是反对的意见。这对各方面的情况能得到充分见尤其是反对的意见。这对各方面的情况能得到充分的反映提供保证。

254、的反映提供保证。 一般地说,这一评价的基本特点是它充分反映了各类一般地说,这一评价的基本特点是它充分反映了各类人员人员“多元的多元的”价值认识,是一种依靠人们直觉与经价值认识,是一种依靠人们直觉与经验的评价。验的评价。260 主要评价模式主要评价模式 模式模式 代表人物代表人物 评价之重点评价之重点 典型问典型问题题 方法论方法论 行为目标行为目标 泰勒泰勒 评价应该评定评价应该评定 学生是否达到学生是否达到 预定的成果预定的成果 学生的进步与学生的进步与 了了目标?是否目标?是否 目标定量的目标定量的 教育创新的结果教育创新的结果 是教是教师引导的?师引导的? 成果变量成果变量 CIPP C

255、IPP 斯塔弗斯塔弗 评价应有助于决评价应有助于决 方案是否有效?方案是否有效? 调查问卷调查问卷 尔比姆尔比姆 策者作出明智的策者作出明智的 哪些地方哪些地方有效?有效? 访问自然访问自然 判断判断 变量变量 目标游离目标游离 斯克里芬斯克里芬 评价应依据那些评价应依据那些 全部效果全部效果 成见控制成见控制 不受方案自身概不受方案自身概 是什么?是什么? 逻辑分析逻辑分析 念框架约束的准念框架约束的准 操作法?操作法? 则评定方案效果则评定方案效果 对手对手 列文列文 评价应向方案价值评价应向方案价值 关于方案关于方案的的 准法律过程准法律过程 持有对立观点的两持有对立观点的两 赞同者与反

256、赞同者与反 派展示最佳案例,派展示最佳案例, 对者的意见对者的意见 使他们根据有关使他们根据有关 是什么?是什么? 方案的同一信息方案的同一信息 作出各自判断作出各自判断 261二、我国学校教育评价模式 (一)我国学校教育评价模式的特点(一)我国学校教育评价模式的特点 1 1、强调评价的判断功能,把评价作为实现目标管理的、强调评价的判断功能,把评价作为实现目标管理的手段。这主要体现在对学校的合格鉴定上,通过制定手段。这主要体现在对学校的合格鉴定上,通过制定出最基本的办学质量标准,使学校教育质量得以基本出最基本的办学质量标准,使学校教育质量得以基本保证。保证。 2 2、强调评价的正确决策服务,即

257、强调评价的信息反馈、强调评价的正确决策服务,即强调评价的信息反馈功能,强调评价为管理者提供实行科学管理所必须的功能,强调评价为管理者提供实行科学管理所必须的反馈信息。例如:通过反馈信息,及时调整工作失误反馈信息。例如:通过反馈信息,及时调整工作失误等等。等等。262(二)我国学校教育评价模式中存在的问题及前景展望(二)我国学校教育评价模式中存在的问题及前景展望 1 1、存在问题:、存在问题: 第一,现有的模式尚不够成熟、完善。第一,现有的模式尚不够成熟、完善。 突出地表现在测量技术的不过硬上。有重原则的讨论,轻技术研究的倾突出地表现在测量技术的不过硬上。有重原则的讨论,轻技术研究的倾向。向。

258、第二,现有的模式比较单一、死板,不够丰富、灵活。第二,现有的模式比较单一、死板,不够丰富、灵活。 评价的研究领域重评价在宏观领域的应用研究,忽视评价在微观领域的评价的研究领域重评价在宏观领域的应用研究,忽视评价在微观领域的应用研究。应用研究。 在评价的指导思想上,重要求、轻需求。即评价一般均指向是要符合要在评价的指导思想上,重要求、轻需求。即评价一般均指向是要符合要求而很少指向学校有何评价需求,忽视指向解决实际问题。评价对学校求而很少指向学校有何评价需求,忽视指向解决实际问题。评价对学校来讲,还是来讲,还是“要我评要我评”,尚未成为,尚未成为“我要评我要评”的自觉行动。的自觉行动。 评价的目的

259、重视评价鉴定,评优的功能,忽视评价诊断、检查的功能。评价的目的重视评价鉴定,评优的功能,忽视评价诊断、检查的功能。 在评价研究的方法论上,侧重从管理的角度多,角度比较单一,重量在评价研究的方法论上,侧重从管理的角度多,角度比较单一,重量化技术,轻其它领域的开拓。化技术,轻其它领域的开拓。 在测试方法上,试题编制比较单调、死板,只注重指标设计的完善,能在测试方法上,试题编制比较单调、死板,只注重指标设计的完善,能全面、准确地体现要求,而忽视有针对性地、灵活地从解决问题出发编全面、准确地体现要求,而忽视有针对性地、灵活地从解决问题出发编制试题。制试题。2632、完善模式首先,要加强评价理论及技术的

260、研究,使得信首先,要加强评价理论及技术的研究,使得信息的质量有保证,评价的结果有说服力;息的质量有保证,评价的结果有说服力;其次,构建模式应突出其特色,从解决问题出其次,构建模式应突出其特色,从解决问题出发,构建其体系。发,构建其体系。模式的单一和僵化,随着评价实践的深入和改模式的单一和僵化,随着评价实践的深入和改革的需要,已暴露出其力不从心的一面,就目革的需要,已暴露出其力不从心的一面,就目前看,教育评价思想,评价领域,评价方法都前看,教育评价思想,评价领域,评价方法都还有着较大的发展余地,评价模式的发展是有还有着较大的发展余地,评价模式的发展是有着广阔的发展前景的。着广阔的发展前景的。26

261、43、丰富评价模式的具体途径 (1 1)“拿进来拿进来”。即直接套用国外已形成的比较成熟的评价模式。即直接套用国外已形成的比较成熟的评价模式。 “拿来拿来”当然不能是盲目地满足于一知半解,而要求我们细致深当然不能是盲目地满足于一知半解,而要求我们细致深入地研究这些模式,只有充分地领会和把握了模式的特点,才能入地研究这些模式,只有充分地领会和把握了模式的特点,才能把模式用在恰当的地方,发挥其更好的效用。把模式用在恰当的地方,发挥其更好的效用。 (2 2)改良。由于不同国家,社会背景不同,教育评价的价值观不)改良。由于不同国家,社会背景不同,教育评价的价值观不一样,因此,对某些评价模式不能完全照套

262、,而应结合国情,从一样,因此,对某些评价模式不能完全照套,而应结合国情,从有助解决中国问题出发,做相应的灵活性的改良。有助解决中国问题出发,做相应的灵活性的改良。 (3 3)创造。即注重在实践中形成和发展的模式。)创造。即注重在实践中形成和发展的模式。 教育评价的模式总是会随着评价实践的积累而日益丰富。不同的教育评价的模式总是会随着评价实践的积累而日益丰富。不同的问题,有不同的解决方法。新问题的提出,旧模式不能回答;新问题,有不同的解决方法。新问题的提出,旧模式不能回答;新模式应当诞生。模式应当诞生。265(三)我国现有的教育评价模式 1 1、教育型目标调控模式、教育型目标调控模式 教育型目标

263、调控模式就是以形成性评价和自我评价为教育型目标调控模式就是以形成性评价和自我评价为中心,充分发挥多种评价功能的一种评价模式。中心,充分发挥多种评价功能的一种评价模式。 (1 1)出发点)出发点 该模式认为,现代教育评价的目的不仅是为了选拔、该模式认为,现代教育评价的目的不仅是为了选拔、鉴定,更重要的是要发挥评价的导向,改进和激励等鉴定,更重要的是要发挥评价的导向,改进和激励等教育功能,促进发展。教育功能,促进发展。 现代教育评价已从静态的终结性评价向重视动态的形现代教育评价已从静态的终结性评价向重视动态的形成性评价发展,评价应重视评价对象的主体地位,形成性评价发展,评价应重视评价对象的主体地位

264、,形成性评价只有与自我评价相结合,才能充分发挥评价成性评价只有与自我评价相结合,才能充分发挥评价的调控和改进功能,克服被评价者的消极情绪,使评的调控和改进功能,克服被评价者的消极情绪,使评价过程成为教育过程。价过程成为教育过程。266(2)含义 教育型教育型表示这种评价模式的指导思想是着眼于教育,表示这种评价模式的指导思想是着眼于教育,通过评价使评价对象受到教育,从而自觉地改进和完通过评价使评价对象受到教育,从而自觉地改进和完善自己的教与学活动,以达到预期的目标。善自己的教与学活动,以达到预期的目标。 目标调控目标调控反映了这种评价模式的结构、功能、过程反映了这种评价模式的结构、功能、过程和手

265、段。和手段。 目标是评价的基础,就是指评价全过程都要以目标目标是评价的基础,就是指评价全过程都要以目标为参照标准。为参照标准。 过程是评价的重点,它表明通过过程评价,突出形过程是评价的重点,它表明通过过程评价,突出形成性自我评价的作用,充分发挥调控功能,使评价过成性自我评价的作用,充分发挥调控功能,使评价过程具有可控性和有效性。程具有可控性和有效性。 自我评价和调控是进行评价的基本方法。自我评价和调控是进行评价的基本方法。 反馈是运行机制,就是指为控制教育系统的活动达反馈是运行机制,就是指为控制教育系统的活动达到目标,及时提供信息、选择矫正的策略和措施,在到目标,及时提供信息、选择矫正的策略和

266、措施,在反馈矫正过程中形成动态序列,一步一步逼近目标。反馈矫正过程中形成动态序列,一步一步逼近目标。267(3)模式的特点 在重视目标评价的同时,十分重视过程评价和结果评在重视目标评价的同时,十分重视过程评价和结果评价、既重视目标的导向,又重视评价过程的反馈、调价、既重视目标的导向,又重视评价过程的反馈、调节,以及评价结果的判断和改进。特别强调形成性评节,以及评价结果的判断和改进。特别强调形成性评价和自我评价的结合。价和自我评价的结合。 教育型目标调控模式以形成性评价和自我评价为中心,教育型目标调控模式以形成性评价和自我评价为中心,十分重视发挥评价的导向、改进和调控功能。十分重视发挥评价的导向

267、、改进和调控功能。2682、协同自评模式 协同自评模式是一种以被评价者自我评价为主,在评价人员的协协同自评模式是一种以被评价者自我评价为主,在评价人员的协同下,共同完成从制定评价目标开始的一系列活动的评价模式。同下,共同完成从制定评价目标开始的一系列活动的评价模式。 (1 1)出发点)出发点 该模式认为在任何教育活动中,只有当事人才能全过程的参与,该模式认为在任何教育活动中,只有当事人才能全过程的参与,才能全面、真实地收集资料。才能全面、真实地收集资料。 通常评价人员只能部分参与其过程,所以评价人员所作出的价值通常评价人员只能部分参与其过程,所以评价人员所作出的价值判断有时难免有失实之处,而当

268、事人作自评时,其评价的能力又判断有时难免有失实之处,而当事人作自评时,其评价的能力又未必符合评价的要求。若能有评价人员的协同,则可弥补其不足。未必符合评价的要求。若能有评价人员的协同,则可弥补其不足。这便形成自我评价为主体,即自评为基础,评价人员协同自评者这便形成自我评价为主体,即自评为基础,评价人员协同自评者进行评价活动,成为者。进行评价活动,成为者。 协同为核心,在评价过程中,自评者与协同者同心协力,经常协协同为核心,在评价过程中,自评者与协同者同心协力,经常协商,不断从对评价观点的不同看法中取得共识,一起来完成包括商,不断从对评价观点的不同看法中取得共识,一起来完成包括从确立评价目标开始

269、,到制定评价方案,进行评价资料的收集,从确立评价目标开始,到制定评价方案,进行评价资料的收集,作出价值判断,撰写评价报告等一系列的评价活动。作出价值判断,撰写评价报告等一系列的评价活动。269(2)基本步骤准备阶段准备阶段由经过培训的协同者(评价人员)拟写一份评由经过培训的协同者(评价人员)拟写一份评价方案,然后由自评者(被评价者)选择协同价方案,然后由自评者(被评价者)选择协同者。者。实施阶段实施阶段首先自评者用拟订的评价方案来评价自己的教首先自评者用拟订的评价方案来评价自己的教育活动(预评价)。了解哪些指标已达到预定育活动(预评价)。了解哪些指标已达到预定目标,哪些指标尚未达标。协同者参与

270、其中,目标,哪些指标尚未达标。协同者参与其中,与自评者共同探讨,获得共识。与自评者共同探讨,获得共识。撰写协同自评报告阶段撰写协同自评报告阶段270(3)模式的特点 第一,被评价者在进行真正的自我评价活动中,表现第一,被评价者在进行真正的自我评价活动中,表现出较强的自主性、自律性、自控性、自励性和自信性。出较强的自主性、自律性、自控性、自励性和自信性。 第二,被评价者和评价人员在评价活动的全过程中,第二,被评价者和评价人员在评价活动的全过程中,建立起民主、协商关系,为达到共同制定的目标而形建立起民主、协商关系,为达到共同制定的目标而形成协同精神,在双方交往中,形成和谐的合作氛围。成协同精神,在

271、双方交往中,形成和谐的合作氛围。 第三,要使协同评价真正发挥它的功能,必须遵循两第三,要使协同评价真正发挥它的功能,必须遵循两个原则:一是平等性原则,二是共建性原则。从评价个原则:一是平等性原则,二是共建性原则。从评价目标的制定,到评价结果的撰写,都是自评者与评价目标的制定,到评价结果的撰写,都是自评者与评价人员共同协商,取得共识,共同构建的产物。人员共同协商,取得共识,共同构建的产物。 协同自评模式是一种以评价者自我评价为主,在评价协同自评模式是一种以评价者自我评价为主,在评价人员的协同下,共同完成从制定评价目标开始的一系人员的协同下,共同完成从制定评价目标开始的一系列活动的评价模式。列活动

272、的评价模式。2713、发展性目标评价模式 这是一种课堂教学评价模式。这种评价模式在强调评这是一种课堂教学评价模式。这种评价模式在强调评价的发展和改进功能的同时,重视对教育目标的评价,价的发展和改进功能的同时,重视对教育目标的评价,当然目标本身也是发展变化的。当然目标本身也是发展变化的。 (1 1)基本思想)基本思想 社会在发展,教育目标是不断发展变化的,以教育目社会在发展,教育目标是不断发展变化的,以教育目标作为依据之一编制成的评价标准需要不断修正、充标作为依据之一编制成的评价标准需要不断修正、充实和调整。实和调整。 以评价标准为核心的评价方案,其实施过程和评价结以评价标准为核心的评价方案,其

273、实施过程和评价结论也是发展、可变的。它也可以在评价活动中针对具论也是发展、可变的。它也可以在评价活动中针对具体情况进行调整。只要能保证评价活动的质量,促进体情况进行调整。只要能保证评价活动的质量,促进教育评价活动的评价理论和方法都能采用。教育评价活动的评价理论和方法都能采用。 整个评价活动要在评价制度的规范下进行。整个评价活动要在评价制度的规范下进行。272(2)基本内容 根据社会发展的需要和开展教育活动的现实条件,确根据社会发展的需要和开展教育活动的现实条件,确定和检验教育目标,使它作为设计评价方案的主要依定和检验教育目标,使它作为设计评价方案的主要依据。再考虑评价对象和条件、与教育评价活动

274、有关人据。再考虑评价对象和条件、与教育评价活动有关人员的愿望、需要和意图以及现有的各种规章制度和科员的愿望、需要和意图以及现有的各种规章制度和科学理论等因素,设计出以评价标准为核心的评价方案。学理论等因素,设计出以评价标准为核心的评价方案。 遵照评价方案,实施评价活动。在评价活动中,注重遵照评价方案,实施评价活动。在评价活动中,注重定量评价方法和定性方法的有机结合以及多种评价类定量评价方法和定性方法的有机结合以及多种评价类型的结合,重视反对意见和非预期效果,有效运用计型的结合,重视反对意见和非预期效果,有效运用计算机技术。算机技术。 完成和反馈评价报告。完成和反馈评价报告。 用评价制度控制和制

275、约整个评价过程,以确保评价质用评价制度控制和制约整个评价过程,以确保评价质量。量。273(3)特点有效吸取了中外主要教育评价模式的长处,如对教育目标进行评价、重视与评价活动有关人员的需要和意图以及注重多种评价类型的结合等。结构紧密、程序规范、可操作性强。适应面宽。274发展性目标评价模式的基本内容是:根据社会发展性目标评价模式的基本内容是:根据社会发展的需要和开展教育活动的现实条件,确定发展的需要和开展教育活动的现实条件,确定和检验教育目标,使它作为设计评价方案的主和检验教育目标,使它作为设计评价方案的主要依据。再考虑评价对象和条件、与教育评价要依据。再考虑评价对象和条件、与教育评价活动有关人

276、员的愿望、需要和意图以及现有的活动有关人员的愿望、需要和意图以及现有的各种规章制度和科学理论等因素,设计出以评各种规章制度和科学理论等因素,设计出以评价标准为核心的评价方案。遵照评价方案,实价标准为核心的评价方案。遵照评价方案,实施评价活动。在评价活动中,注重定量评价方施评价活动。在评价活动中,注重定量评价方法和定性方法的有机结合以及多种评价类型的法和定性方法的有机结合以及多种评价类型的结合,重视反对意见和非预期效果,有效运用结合,重视反对意见和非预期效果,有效运用计算机技术。完成和反馈评价报告。用评价制计算机技术。完成和反馈评价报告。用评价制度控制和制约整个评价过程,以确保评价质量度控制和制

277、约整个评价过程,以确保评价质量275小结上述教育评价模式都不是十全十美的,都有各自的优越性和局限性,也各有自己不同的适用范围,充分了解和认识这些问题,有助于我们选择最合适的教育评价模式,并且,能创造出更加科学和富有中国特色的教育评价模式。教育评价模式牵动着教育评价全局,它制约着教育评价的规范性,也制约着评价结果的效用。276总结 教育评价模式牵动着教育评价全局,它制约着教育评教育评价模式牵动着教育评价全局,它制约着教育评价的规范性,也制约着评价结果的效用。价的规范性,也制约着评价结果的效用。 国外学者对评价模式进行了较为系统的研究,提出了国外学者对评价模式进行了较为系统的研究,提出了众多的评价

278、模式,如泰勒模式、众多的评价模式,如泰勒模式、CIPPCIPP模式、目标游离模式、目标游离模式、对手模式等等。模式、对手模式等等。 我国学者也在教育评价实践中总结、提炼出教育型目我国学者也在教育评价实践中总结、提炼出教育型目标调控模式、协同自评模式、发展性目标评价模式等标调控模式、协同自评模式、发展性目标评价模式等等。等。 各种评价模式都有其优越性和局限性,评价者应充分各种评价模式都有其优越性和局限性,评价者应充分考虑评价的目的、对象特点等因素,从各种模式中吸考虑评价的目的、对象特点等因素,从各种模式中吸取合理的成分,提高评价的教育性和实践性。取合理的成分,提高评价的教育性和实践性。277二、

279、测验理论(一)经典测验理论(简称(一)经典测验理论(简称CTTCTT)经典测验理论是最早的测验理论,它是最适用经典测验理论是最早的测验理论,它是最适用的测验理论,也是一种信度理论,因为它的主的测验理论,也是一种信度理论,因为它的主要目的是在估计某个测验实得分数的信度。要目的是在估计某个测验实得分数的信度。经典测验理论的理论基础是真分数模型,所以经典测验理论的理论基础是真分数模型,所以又称它为又称它为“真分数理论真分数理论”。因为经典理论的假。因为经典理论的假设内涵主要以真实分数模式为理论架构,依据设内涵主要以真实分数模式为理论架构,依据弱势假设而来的。弱势假设而来的。真分数模型是以弱假设为基础

280、的,即这些假设真分数模型是以弱假设为基础的,即这些假设很容易验证并易被大多数测验数据资料所确定。很容易验证并易被大多数测验数据资料所确定。2781、主要优点 广泛性。经典测验理论是以弱假设为基础的,这弱假广泛性。经典测验理论是以弱假设为基础的,这弱假设条件容易被绝大多数测验数据资料所满足。所以从设条件容易被绝大多数测验数据资料所满足。所以从实际应用来说,假设条件容易满足,其应用具有广泛实际应用来说,假设条件容易满足,其应用具有广泛性。性。 普遍性。经典测验理论经过几十年的发展,形成了一普遍性。经典测验理论经过几十年的发展,形成了一套以真分数理论为基础的较完善的测验理论和对题目套以真分数理论为基

281、础的较完善的测验理论和对题目与测验进行统计及分析的方法,且这些方法在计算上与测验进行统计及分析的方法,且这些方法在计算上较为简单,意义上也直观明了,易于理解和掌握,所较为简单,意义上也直观明了,易于理解和掌握,所以应用上具有普遍性。以应用上具有普遍性。 原则性。我国教育工作者在社用过程中和实践中不断原则性。我国教育工作者在社用过程中和实践中不断形成和完善了一套适合国情的具体应用方法和应用原形成和完善了一套适合国情的具体应用方法和应用原则。则。2792、主要局限性用经典测验方法所求得的参数会受到不同样本组能力水平的影响。考生能力的估计会由于测验的改变而改变。经典测验理论中两个相当重要的假设条件严

282、格平行测验和误差与真分数不相关,在实际操作中是难以做到的。280(二)题目反应理论 题目反应理论(简称题目反应理论(简称IRTIRT)是建立在潜在特质理论的基)是建立在潜在特质理论的基础上的。础上的。 题目反应理论认为:在认知测验中,潜在特质指所要题目反应理论认为:在认知测验中,潜在特质指所要测的内在能力。测的内在能力。 定量地估计个体在每一种特质上的位置是心理测量的定量地估计个体在每一种特质上的位置是心理测量的任务。但是,由于心理特质的潜在性在实践中给心理任务。但是,由于心理特质的潜在性在实践中给心理测量带来很大的困难,心理学家只能依据可观测的变测量带来很大的困难,心理学家只能依据可观测的变

283、量来鉴别和定义这些特质,并希望能探明哪些特质所量来鉴别和定义这些特质,并希望能探明哪些特质所起的作用是最重要的,哪些特质对人的行为发展起着起的作用是最重要的,哪些特质对人的行为发展起着重要的作用等。重要的作用等。 题目反应理论的最大特点:它找到了一条题目特征曲题目反应理论的最大特点:它找到了一条题目特征曲线(简称线(简称ICCICC)并且以多种数学表达式(即数学模型)并且以多种数学表达式(即数学模型)来描述它和逼近它。来描述它和逼近它。2811、题目反应理论的优点题目难易度的估计不因样本不同而不同。考生能力的估计不因测验的改变而改变。测量误差的估计因考生程度不同而不同。为多种形式测验的实施提供

284、了更为完美的理论和方法。2822、主要局限性对数学模型与实测数据的拟合要求较高。题目反应理论是一维性假设,是对任何数学模型的共同假设,这是测验编制者希望提高测验分数的可解释性。但是到目前为止,尚没有一种能验证一维性假设的方法。283(三)经典测验理论与题目反应理论的比较1、参数稳定性2、能力的比较3、平行复本难实现4、缺乏预测能力5、测量标准误284小结20世纪50年代之前,为经典测验理论阶段;20世纪50年代之后,是多种理论并存阶段。经典测验理论在测验发展中有着重要的作用,它是历史上第一个测验理论,也是测验理论的研究基础上,到现在仍有广泛的应用。题目反应理论是克服经典测验理论中题目参数等指标

285、的变异性发展起来的。285三、现代教育测量与评价发展趋势1、教育测量与评价的政治性得到加强2、教育测量与评价的教育功能得到强化3、教育测量与评价理论研究得到突破性进展4、计算机技术的发展提高了测验的效率286练习题 1 1、用某测验对、用某测验对1010个学生进行测验,得分记为个学生进行测验,得分记为X X,为了考查测验结果的可,为了考查测验结果的可靠性,在两周后用这个测验对这个靠性,在两周后用这个测验对这个1010个学生重测一次,得分尼为个学生重测一次,得分尼为Y Y,问该,问该测验的信度如何?测验的信度如何? 学生序号学生序号 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5

286、6 7 8 9 10 得分得分X 7 10 9 7 9 8 6 7 9 4 X 7 10 9 7 9 8 6 7 9 4 得分得分Y 8 10 9 7 9 8 5 8 10 4Y 8 10 9 7 9 8 5 8 10 4 2 2、已对、已对1010名学生进行了测验名学生进行了测验A A,接着对这,接着对这1010人进行了与测验人进行了与测验A A等值的测验等值的测验B B,两次测验的分数分别为,两次测验的分数分别为X X和和Y Y,求测验的信度?,求测验的信度? 学生序号学生序号 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 得分得分X 9 10 9 6

287、 10 7 6 7 9 6X 9 10 9 6 10 7 6 7 9 6 得分得分Y 5 9 7 9 5 4 5 3 3 4Y 5 9 7 9 5 4 5 3 3 4 3 3、用一个由、用一个由2020个题目构成的测验对个题目构成的测验对1010个高中三年级的学生进行测验,测个高中三年级的学生进行测验,测验结果如下,测验一次后,学生已毕业,试估计测验的信度?验结果如下,测验一次后,学生已毕业,试估计测验的信度? 学生序号学生序号 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 109 10 奇得分奇得分X 37 36 37 40 39 35 37 38 X 37 36 37 40 39 35 37 38 39 34 39 34 偶得分偶得分Y 36 36 35 38 38 33 37 38 Y 36 36 35 38 38 33 37 38 38 3538 35287谢谢,再见!谢谢,再见!288

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号