有关心理测验的信度与效度

上传人:ap****ve 文档编号:118767024 上传时间:2019-12-25 格式:PPT 页数:113 大小:1.66MB
返回 下载 相关 举报
有关心理测验的信度与效度_第1页
第1页 / 共113页
有关心理测验的信度与效度_第2页
第2页 / 共113页
有关心理测验的信度与效度_第3页
第3页 / 共113页
有关心理测验的信度与效度_第4页
第4页 / 共113页
有关心理测验的信度与效度_第5页
第5页 / 共113页
点击查看更多>>
资源描述

《有关心理测验的信度与效度》由会员分享,可在线阅读,更多相关《有关心理测验的信度与效度(113页珍藏版)》请在金锄头文库上搜索。

1、第四章 心理测验的 信度与效度 任滨海 2 提纲 v信度 信度概述 信度的类型 影响信度的因素 v效度 效度概述 效度的类型 影响效度的因素 3 SV2SI2SE2 SX2 ST2 4 第一节 信 度 一、信度定义 v 1、通俗的定义 信度,即测量的可靠性,多次测量结果保持一致性的程 度。 5 v2、测量学定义: 信度为一组测量分数的真分数方差和总方差(实得分数 的方差)的比率。 l信度乃是一个被试试群体的真分数与实实得分数的相关系数 的平方。 l信度乃是一个测验测验 X与它的任意一个平行测验测验 Y的相关系 数。 信度只受随机误差影响,系统误差不影响信度 6 二、信度的指标 信度以信度系数为

2、指标,常用相关系数表示,表示实得 分数的变异数中有多少比例是由真分数的变异决定的, v信度系数以相关系数为指标,rxx=rxT2=ST2/SX2 v信度的平方根就是信度指数,rxT=ST/SX 7 信度指数(rxT)与信度系数(rXX) 实得分数 x2 真实分数 T2 rxx 信度系数(百分比) rOT2信度指数 (实得分数与真实分数的相关) rxx = rxT2 8 v信度定理: 定理 1:如果满足独立性条件(即误差分数与真分数无关) 时,真分数方差与观察分数方差之 比(信度系数)等于真分 数与观察分数之间的相关系数的平方。 定理 2:如果满足平行测验条件 时,真分数方差与观察 分数方差之比

3、(信度系数)等于两个平行测验的观察分数之 间的相关系数 。 补充:信度系数、信度指数、测定系数的讨论 Baidu 测定系数 信度系数 搜索。 9 三、信度的评估方式 v(一)重测信度 v(二)复本信度 v(三)内在一致性信度 v(四)评分者信度 10 (一)重测信度 1、定义:用同一个测验对同一组被试在不同时间施测两次所得结 果的一致性程度,其大小等于同一组被试在两次测验上所得分数的 皮尔逊积差相关系数。又称稳定性信度、再测信度、施测再施测 信度、跨时间一致性。 11 施测施测 时间间隔时间间隔 再施测再施测 相关系数相关系数 图1 重测信度图式 10名学生幸福感调查的两次施测分数 重测信度的

4、计算举例 ABCDEFGHIJ 16151313111010987 1516141210911867 X1 X2 13 2、注意事项: v所测量的心理特性必须是稳定的。 v遗忘和练习的效果基本上是相互抵消的。 v在两次施测的间隔时期内,被试在所要测验的心理特 质方面没有获得的更多的学习和训练。 v易受练习和记忆的影响,两次测试的时间间隔要适当 ,一般是24周较宜,间隔时间最好不超过6个月。 14 (二)复本信度 1、定义:又称等值性系数,是以两个等值但题目不同的 测验(复本)来测量同一群体,然后求得被试者在两个 测验上得分的相关系数。 2、方法:为排除施测顺序的影响,在实施时,可将被试 先分为

5、两组,一组人先作A型测验,再作B型测验;另一 组人则反之。 15 施测型施测型 最短时距最短时距 施测型施测型 相关系数相关系数 图2 复本信度图式 10名学生创造力的复本测验结果 复本信度的计算举例 ABCDEFGHIJ X1 X2 20191818171614121210 2020191616171211139 17 v3、注意事项 要构造真正的平行测验 v 复本测验必须在题目的内容、数量、形式、难度、 区分度、指导语、时限以及所用的例题、公式、测验 其它方面都相同或相似。 被试有条件接受两个测验。 18 (三)内部一致性信度 v1、定义: 反映的是题目之间的关系,表示测验能够测量相同内容

6、 或特质的程度。 v2、方法: (1)分半信度: v通常是先把一份测验按题目的奇偶顺序或其它方法分 成两个尽可能平行的半份测验,然后计算两半之间的 相关,即得到分半信度系数。 19 v两半变异数相等: 积差相关 斯皮尔曼布朗公式校正 20 l变异数不相等: l弗朗那根(Flanagan)公式: l卢伦(Rulon)公式: 21 (2)同质性信度: v测验内部所有题目间的一致性。用每个题目和其它题目平均数 的相关。当各测题得分有较高的正相关时,即为同质;相反, 测题间相关很低或为负相关则为异质。 v0、1计分项目(库德(Kuder) -理查逊(Richardson)方法) v非0、1计分项目(系

7、数或克伦巴赫(Cronbach)公式 ) 22 注意事项 v 在一个测量多种特质的问卷中,不同的因子的同 质性信度应该分开计算。 v克伦巴赫系数相当于计算了所有项目间的一致性 程度,避免了分半信度由于分半方式不同所造成的 分半系数不一致的问题。 23 (四)评分者信度 v1、定义:用于测量不同评分者之间所产生的误差 。是由多个评分者给一组测验结果评分,所得各个 分数之间的一致性。 l对于客观性试题,评分所引起的误差或忽略不计 l对于主观性题目来说,不同评分人员对相同被试的评分存在差异。 如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的 面试等。 l一般要求在成对的受过训练的评分者之间

8、平均一致性达0.90以上,才 认为评分是客观的。 24 v2、计算 当评分者为2人时,可以积差相关或等级相关 当评分者多于2人时,可以使用肯德尔和谐系数 25 如有A、B、C三位专家给6位应聘者的面试评分,结果 如下,试求评分者信度。 ABC 1756645 2907260 3816354 4606042 5847563 6969066 ABCRi 154514 22237 345413 466618 53328 61113 26 =14+7+13+18+8+3=63 =142+72+132+182+82+32=811 由题意知 K=3, N=6, 将上述值代入公式有: W= =0.95 如在

9、评定中有相同的等级时,用下式校正。其中n为 相同等级的个数 27 四、信度对测验分数的意义 v1、解释真实分数与实得分数的相关 信度系数可以解释为测验的总变异中,真分数造成的变 异占百分之几。如,当rxx=0.90时,我们可以说实得分 数中有90%的变异是真分数造成的,仅10%来自测验的误 差。rxx=1.00,则表示完全没有测量误差,所有的变异 均来自真实分数;同样,信度系数也告诉测量的误差比 例是多少。 28 v2、确定信度可以接受的水平 一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情 况是rxx=1.00,但实际上是办不到的。根据多年的研究结果,一般 的能力测验和成就测验的信

10、度系数都在0.90以上,有的可以达0.95 ;而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.85 或更高些。一般原则是:当rxx0.70时,测验不能用于对个人做出 评价或预测,而且不能作团体比较;当0.70rxx0.85时,可用于 团体比较;当rxx0.85时,才能用来鉴别或预测个人成绩或作为。 29 v3、解释个人分数的意义(区间估计) 从信度可以解释个人分数的意义,这就是测量标准误的 应用。它有两个作用 v其一是估计真实分数的范围; v其二是了解实得分数再测时可能的变化情形。 30 v由于误差的存在,一个人通过测量得到的分数很难 等于真分数。理论上,我们可以对一个人施测无数

11、次,然后求得所得分数的平均数和标准差。在这个 假设的分布里,平均数就是这个人的真分数,标准 差则为误差大小的指标。 31 32 v在实际工作中,我们用一组被试(人数足够多)两 次施测的结果来代替对同一个人反复施测,以估计 测量误差的变异数。此时,个人在两次测验中的分 数差异就是测量误差。据此可制成误差分数的分布 。这个分布的标准差(误差分布的标准差)我们称 之为测量的标准误,是表示测量误差的大小的指标 ,其计算公式为: v (公式54) v式中SE表示测量的标准误,即误差分布的标准差; Sx表示一次测量分数的标准差;rxx表示信度系数。 33 v我们可以用测量的标准误来估计个人测验的真分数 的

12、大小。 v如果选用95的可靠性水平(置信水平),即显著 性水平(a值)为.05,真分数有95的可能落入 X 1.96SE ,即X 1.96 SE的范围之内,也可以 写成X1.96SE T X1.96 SE,SE则用公式5 4代入。或有5的可能落入这范围之外。这实际 上也表明了再测时分数改变的可能范围。 34 v例1,已知WISC-R的标准差为15,信度系数为 0.95,对一名12岁的儿童实施该测验后,IQ为 110,那么他的真分数在95的可靠度要求下 ,变动范围应是多大? 35 = 103.4 116.6 36 v注意几点: v(1)SE对真分数做的是区间估计,不可能由 此得到一个确切的点。这

13、就是说,测验分数不 是一个定点,而是具有一定的分布范围。因此 ,两次测验分数之间存在差异是很正常的。 v(2)置信水平确定后,估计的精度主要取决 于SE,SE越小,范围越小,估计就越精确,反 之也然。 v(3)真分数不能等同于真正能力或心理特质 ,真分数中包括了系统误差。 37 v4、比较不同测验分数的差异 测量标准误和测验信度在评价两个不同测验的分数是 否有明显差异时也非常重要。这种比较包括两个人不同 分数的差别和同一被试在两个测验上的差别。 38 v我们可以用“差异的标准误”来检验差异的显著性。 v差异的标准误的公式为: v (公式55) v 为差异的标准误,S为相同尺度的标准分数的标准差

14、 ,Z分数为1,T分数为10。 、 分别为两个测验的信度 系数。 v先将原始分数化成标准分数,然后将两个标准分数的差异 与1.96SEd(0.05显著性水平)进行比较,如果其绝对值 大于此值,则差异显著,否则差异不显著。 39 例题 v某被试在韦氏成人智力测验中言语智商为102,操 作智商为110。假设言语测验和操作测验的信度分 别为0.87和0.88,则该被试的操作智商与言语智商 有显著性差异吗? v解答一: 标准分数差异的范围(95%): -1.967.51.967.5 -14.714.7 所以被试的操作智商与言语智商无显著性差异 40 解答二 41 v例,某校五年级进行了两次数学测验,小

15、张第一 次考了85分,此次数学测验年级平均分是77分, 标准差是8分,此次测验的信度系数是0.84;第 二次考了95分,此次数学测验年级平均分是81分 ,标准差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显著差异? v 42 五、影响信度的因素 v样本的影响 样本团体的异质性高,信度就高 样本团体平均能力水平的影响 v测验长度的影响 可以通过增加测验长度的方式提高信度值。 v新增项目必须与试卷中的原有项目同质。 v新增项目的数量必须适度。 43 v如由50题组成的儿童心理学测验,其信度系数为 0.72,若再增加30个与原测验难度相近且同质性 的题目,问长度增加后的测验系数是多少? = 0.80 44 v例:有一个包括10个题目的测验,信度

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号