教育测量.ppt

上传人:j7****6 文档编号:61728098 上传时间:2018-12-11 格式:PPT 页数:123 大小:577.50KB
返回 下载 相关 举报
教育测量.ppt_第1页
第1页 / 共123页
教育测量.ppt_第2页
第2页 / 共123页
教育测量.ppt_第3页
第3页 / 共123页
教育测量.ppt_第4页
第4页 / 共123页
教育测量.ppt_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《教育测量.ppt》由会员分享,可在线阅读,更多相关《教育测量.ppt(123页珍藏版)》请在金锄头文库上搜索。

1、教育测量,杨福义 讲师 博士 华东师范大学 Email: 电话:021-62232680 13816057967 2007年8月,教育测量课程内容,第一章 教育测量的基本原理 第二章 测验的性质、种类和功能 第三章 信度的理论定义、操作定义及其估计方法 第四章 效度的理论定义、操作定义及其估计方法 第五章 测题分析 第六章 测验量表和常模 第七章 测验编制的步骤和方法 第八章 测验例举,教育测量课程考核,总评成绩由平时成绩考试成绩组成 平时成绩占20,包括考勤和作业。 考试成绩占80,闭卷考试,时间为2小时,可以使用计算器。,第一章 教育测量的基本原理,一、测量的概念,1、测量的定义 测量根据

2、法则给事物分派数字。(史蒂文斯,1951) 例1:测量学生体重 测量的属性:“体重” 规则:“身穿极少量衣服,赤脚自然地站在体重计上” 用来描述学生体重的数:体重计上指示的“数字” 例2:评定学生道德品德,2、测量的三要素 事物的属性测量的对象 物理属性:长度、重量、体积、温度、时间等 心理属性:智力、个性、能力、知识、技能、态度、兴趣等 数字描述事物属性的符号 同一性和区分性:每一个数的独特性 等级性或位次性:若干个数之间按其大小所形成的次序关系 等距性 等比性,规则给事物的属性分派数字的依据 规则是指导我们如何测量的一种准则或方法。 当测量的其他条件相同时,使用不同的规则,会产生不同的测量

3、效果。 规则的好坏,取决于制定规则的程序和所欲测量的事物属性本身 是否易于建立规则和便于操作规则,二、教育测量,1、教育测量的定义 广义教育测量就是对于教育领域内的事物或现象,根据一定的客观标准,作缜密的考核,并依据一定的规则将考核的结果予以数量的描述。 狭义教育测量是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测量。,2、教育测量的两要素 参照点人为指定的相对零点 单位无统一单位,也不符合等距要求,三、教育测量的可能性,凡物之存在必有其数量(桑代克,1918) 凡有数量的现象都可以测量(麦柯尔,1923),四、教育测量的特点,间接性 相对性,五、四种测量量表,广义量表(scale

4、)任何可以使事物数量化的值和量的渐进系列。 测量的本质是根据某一法则将事物数量化,即在一个定有参照点和单位的连续体上把事物的属性表现出来,这个连续体即为量表. 只要将预测的事物属性放在这个连续体的适当位置上,看它们距离参照点的远近,便会得到一个测量值.,1、名称量表,名称是测量中最简单的形式,即分类。 在名称量表中,用来描述事物的数字仅仅是代表事物的符号,只能区分事物的类别。 适用的统计方法:比率、百分比、相关系数, 2检验。,2、等级(位次)量表,按某一标准对事物的属性进行分类,用来描述各个类别的数字不仅具有区分性,而且还具有等级性,用这样的数字表示的量表称为等级量表或位次量表。 量表上的数

5、字不能进行加减乘除运算。 适用的统计方法:中位数、百分位数、等级相关系数、肯德尔和谐系数、符号检验、秩次检验、秩次方差分析。,3、等距量表,有相等单位和人定参照点的量表称为等距量表。 量表上的数值不仅具有区分性、等级性,还有等距性。 可以作加减运算,但不能作乘除运算。 适用的统计方法:算数平均数、标准差、积差相关系数、Z检验、t检验、F检验。,4、比率(等比)量表,有相等单位和绝对零点的量表称为比率量表。 量表上的数值可以进行加减乘除运算。 适用的统计方法:算数平均数、标准差、积差相关系数、Z检验、t检验、F检验、几何平均数、差异系数。,六、教育测量的量表属性,教育测量中上述四种量表都有。 心

6、理(知识、技能)测验多属于等级量表。 通常仍将测验分数作为等距量表来处理:,第二章 测验的性质、种类和功能,一、测验的概念,1、测验的定义 心理测验是一种对行为样本的客观和标准化的测量(阿纳斯塔西,1967) 广义心理测验包括智力、人格、能力倾向、学业成就等测验。 教育测验主要是学业成就测验,所以该定义也适用于教育测验。 2、测验的三要素 行为样本 测验的标准化 测验的客观性,二、行为样本,行为样本对于所欲测量的心理属性具有代表性的一组行为反应。,三、测验的标准化,测验的标准化测验的编制、实施、记分、分数的解释都按照统一的标准和严格的规定进行,使所有被试的测验条件一致。包括四方面: 测验材料的

7、标准化 测验实施的标准化 评分、记分的标准化 测验分数解释的标准化,四、测验评价的客观性,信度 效度 难度 区分度,五、测验误差的来源,1、测验本身 测题本身的代表性 测题的数量 测题的种类 2、测验实施 测验情境 主试的影响 意外干扰,3、被试状态 生理状况 情绪状况 练习因素,六、标准化测验准备和实施 中应注意的问题,(一)测验的准备 1、主试准备 2、测验环境准备 房间 座位 材料 人物 3、被试准备 时间选择 主试与被试建立和睦关系,(二)测验的实施 测验前期工作 测题的选定 记录 正确对待被试的要求 主试注意事项,(三)测验结果解释 被试测验前后的行为是否一致 被试在强项和弱项测验内

8、容方面的表现 被试的测验行为是不是一般行为,即测验表现是否代表在校或在家的行为 评定测验成绩一般不要采用绝对化的语言,应该综合其他评定量表或评判标准作综合界定,七、测验的种类,1、根据测量的属性 智力测验 能力倾向测验 人格测验 教育测验 2、根据测验的标准化程度 标准化测验 教师自编测验,3、根据测验的功能 普通测验和诊断测验 难度测验和速度测验 预测测验和成绩测验 4、根据记分标准 常模参照测验 标准参照测验,5、根据同时受测的人数 个别测验 团体测验 6、根据测验所用的材料和形式 语言或文字测验 非语言文字测验,八、测验的功能,了解个别差异 检查和巩固学习 辨别智愚和分类安置 选拔人才

9、对比实验 考查学习努力程度 预测能力 指导就业 课程评价,第三章 信度的理论定义、操作定义及其估计方法,第一节 信度的理论定义和操作定义,一、信度的理论定义,1、信度与误差的关系 (1)一般统计资料的三种误差 抽样误差 测量误差 系统误差 (2)信度与误差的关系 抽样误差可以忽略不计 系统误差影响不大 测量误差是影响信度的主要原因,2、信度的理论定义 测验分数都包括两个部分:真分数测量误差 信度是一组测验分数中真分数方差与获得分数方差的比率。 真分数理论的三个假设: 误差分数的平均数等于零 误差分数与真分数之间无相关 两次测量的误差分数之间相关为零,二、信度的操作定义,信度是同一个测验(或相等

10、的两个、多个测验)对同一组被试实施两次或多次,所得结果的一致性程度,也即测验的可靠性。 测验的信度以两次测验结果的相关系数表示。,第二节 再测信度,一、再测信度及其估计方法,1、再测信度的定义 再测信度以同一个测验对同一组被试先后实施两次,所得结果的相关系数。 若对同一组被试先后实施多次,可用每两次测验结果的相关系数之平均数来表示。 再测信度又称为稳定系数,2、再测信度的估计方法 用原始数据计算 用样本平均数和样本标准差计算 用样本平均数和总体标准差的估计值计算,某算术运算速度两次测验分数,二、再测信度的优缺点,优点 缺点,三、再测信度的适用范围,异质性测验 速度测验 运动技能测验,第三节 复

11、本信度,一、复本信度及其估计方法,1、复本信度的定义 复本信度等值性的两个测验对同一组被试实施结果的一致性程度。 复本测验是指在性质、内容、题型、题数、难度等方面都一致或相等的两个或多个测验。 若复本的个数在两个以上,可用每两个复本测验结果的相关系数之平均数来表示。 复本信度系数分等值系数和稳定等值系数两种,2、复本信度的估计方法 用原始数据计算 用样本平均数和样本标准差计算 用样本平均数和总体标准差的估计值计算,二、复本信度的优缺点,优点 缺点,三、复本信度的适用范围,是考察测验可靠性的最好方法,第四节 内在一致性信度,一、内在一致性信度及其估计方法,再测信度:测验在不同时间的一致性 复本信

12、度:测验的两种不同形式的一致性 内在一致性信度:测验内部(测题之间的一致性),(一)分半信度,斯皮尔曼布朗公式矫正法 卢农公式矫正法 弗拉南根公式矫正法,(二)同质性信度,0、1记分测验的同质性信度 非0、1记分测验的同质性信度,二、内在一致性信度的优缺点,优点 缺点,三、内在一致性信度的适用范围,同质性测验 难度测验,第五节 评分者信度,一、评分者信度的定义,评分者信度是指多位评分者对同一组被试作答反应评分的一致性程度,二、评分者信度的估计方法,积差相关或等级相关估计法 系数估计法 肯德尔和谐系数估计法,信度估计方法的总结,第四章 效度的操作定义及其估计方法,效度一个测验对其所欲测量的属性能

13、够确实测到的程度,即测验的正确性。 根据美国心理学会的标准,测验的效度分为三大类: 效标关联效度 内容效度 结构效度,效度的相对性,一个测验的有效性,总是就其特殊的目的、功能和适用范围而言的,并不是就任何目的、功能和任何适用范围而言的。 按照特定的目的精心编制的测验,其效度不是全有全无的区别,只是程度上的不同。,第一节 效标关联效度,一、效标关联效度的概念,效标关联效度是指以某一种测验分数与其效标分数之间的相关来表示的效度,又称为统计效度。 效标指确能显示或反映所欲测量的属性的变量。是考察检定测验效度的参照标准。,智力测验效标学科成绩、教师评定等级、受教育年限、年龄等。 能力倾向测验效标特殊能

14、力或特殊训练的成绩 教育测验效标相应的学科成绩或教师的等级评定 职业兴趣测验实际工作成绩或记录,同时效度和预测效度,根据获得测验分数和效标分数的时间关系,可以将效标关联效度分为同时效度和预测效度。 同时效度以测验分数与现有效标分数之间的相关表示的效度。 预测效度以被试的测验分数与其未来效标分数之间相关表示的效度。,二、效标关联效度系数的计算,测验分数与效标分数之间的相关系数称为效标关联效度系数。 1、积差相关法 当测验分数和效标分数均为正态连续变量时采用 2、二列相关法 当测验分数和效标分数均为正态连续变量,而其中一个变量被人为地分成二分变量时。,3、点二列相关法 当测验分数和效标分数其中一个

15、变量为连续变量,而另一个为真正的二分变量或双峰分布变量时。 4、等级相关法 当测验成绩和效标成绩两个都(或其中一个)以等级次序排列或以等级次序表示时。,5、四分相关及相关法 当测验成绩和效标成绩都是二分变量或以二分变量表示时。 6、列联相关 当测验和效标成绩中有一个不止分为两个类别时。,第二节 内容效度和结构效度,一、内容效度,1、概念及意义 内容效度指测验内容对所要测量的内容的代表性程度。 2、建立过程 3、检定方法 (1)逻辑判断法 一般由本学科的专家根据所欲测量属性的定义和测量内容范围的界定,以及各部分内容,各认识层次的比重,用逻辑分析的方法对策得体性能是否能代拨所欲测量的内容及教育目标

16、作出判断。,(2)比较平均数差异的显著性 对同一组被试用一个测验的两个复本在某一学科教学或训练前后实施测验,根据两次测验成绩差异的显著性来判断该测验内容的有效性。 (3)相关法 用反映同一内容的两个不同测验对同一组被试施测结果的相关系数表示。,4、提高内容效度的方法 增加测题的同质性 专家小组平行作业法 多人裁判法 5、表面效度 表面效度指测验在表面上使被试直觉感到的有效性程度。 为了使测验具有表面效度,必须根据测验的性质、被试的年龄和知识背景来选择测验材料和习惯用语。 表面效度不是测验的真正效度。,二、结构效度,1、概念 指测验对于人的假设属性或理论概念测量到的程度。 2、建立过程 对所欲测量的属性根据某种理论提出假定的结构 根据假定的结构拟定测题和编制测验 寻求测验分数与其它评定之间的关系 根据测验结构来验证假设结构中的各种因素是否成立 修改测验,重新实

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号