心理测量学第三章和第四章

资源描述

《心理测量学第三章和第四章》由会员分享，可在线阅读，更多相关《心理测量学第三章和第四章（68页珍藏版）》请在金锄头文库上搜索。

1、第三章经典测验理论的基本假设,主讲：许莹电邮：,2019/2/1,2,第一节心理特质及其可测性假设,2019/2/1,3,一、心理特质的含义,内涵表现在一个人身上所特有的相对稳定的行为方式为人的心理特质（trait）。理解特质是一组具有内部相关的行为的概括，具有一定的抽象性，如善良、聪明。比较稳定，对不同的刺激做相同的反应；,2019/2/1,4,特质是一个人身上比较稳定的特点。一个人的精神面貌（人格）是由多种特质分多个层次有机组合而成的。智力可以分语言和操作，语言可以分为词汇和文法。特质可以决定一个人对特定刺激的反应倾向，可以对人的行为进行某种预测。,2019/2/1,5

2、,二、心理特质的可测性,Thorndike“凡客观存在的事物都有其数量。” McCall“凡有数量的东西都可以测量。,2019/2/1,6,第二节测量误差及其来源,2019/2/1,7,一、测量误差的含义,定义在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。理解测量误差由那些与测量目的无关的变因所致测量误差表现为不准确或不一致两种方式。,2019/2/1,8,二、测量误差的种类,系统误差：由与测量目的无关的变因引起的一种恒定而有规律的效应（稳定）；随机误差：由与测量目的无关的、偶然因素引起、而又不易控制的误差（不稳定）。,2019/2/1,9,（一

3、）测量工具（测验内部）引起的误差题目取样(影响最大) 指导语难度时限测验复本不等值,三、测量误差的来源,2019/2/1,10,（二）由测量对象引起的误差（最复杂最难控制的误差）测验的经验练习因素应试动机测验焦虑反应定势生理因素,2019/2/1,11,（三）由施测过程引起的误差物理环境主试者方面意外干扰评分计分,2019/2/1,12,第三节真分数及其有关的假设,2019/2/1,13,一、真分数的含义,真分数（True Score）：一个测量工具在没有测量误差时，所得到的纯正值。操作定义：经过无数次测量所得到的平均值。观察分数（Observed Scor

4、e）：实测分数,2019/2/1,14,某一物理测量数据,(1) 实测重量=真实重量+误差 (2) 误差之和为零 (3) 实测重量的平均值=真实重量的平均值,2019/2/1,15,二、数学模型及其假设（一）CTT的数学模型经典测验理论假定，观察分数（记为X）与真分数（T）之间是一种线性关系，并只相差一个随机误差（记为E）。即 X = T + E （二）3个相关联的假设公理 1.若一个人的某种心理特质可以用平行的测验反复测量足够多次，则其观察分数的平均值会接近于真分数。即：E（X）=T或E（E）=0 2.真分数和误差分数之间的相关为零。即：（T，E）=0,2019/2/1,16,SX

5、2,ST2,3.各平行测验上的误差分数之间相关为零。即（E1，E2）= 0,SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2,2019/2/1,17,第四章测量信度,2019/2/1,18,请列举一些你所使用过或接触过的量表,思考: 量表的作用是什么？,2019/2/1,19,你如何解释下述现象？,一个很聪明的孩子，测得智商是80分一个学习很好的学生，考试成绩为60分一个人缘很好的人，人际关系测量低于常模值,2019/2/1,20,量表帮助我们了解心理现象（心理特质），就像尺子帮助我们测量身高。,思考:我们如何知道我们有多高？

6、有两个工具：尺子 / 秤,2019/2/1,21,尺子的数据与我们的目测更一致，而秤盘的数据则与我们的目测不一致。因此，尺子是测量身高的有效工具效度。,什么材料的尺子？钢铁（热胀冷缩）涉及到一致性的问题。信度,2019/2/1,22,1.70=1.7 ?,2019/2/1,23,量表是我们用来了解心理特质的工具，但这个工具是有误差的。误差是不可避免的,但误差要控制在一个许可的范围内。,2019/2/1,24,回顾,什么是误差? 误差的种类有哪些?,2019/2/1,25,第一节信度概述一、什么是信度？信度（reliability）是指测量结果的稳定性程度，也叫测量的可靠性。操作定义

7、：指真实方差除以测量方差所得的商. 注意：（1）信度指的是一组测验分数或一系列测量的特性，而不是个人分数的特性；（2）真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数作出估计。,2019/2/1,26,三种等价的信度定义,定义一信度乃是一个被测团体真分数的变异数(方差)与实得分数的变异数(方差)之比。如果他们的比率是.87，说明了什么？,测量方差的87%属于真实方差,2019/2/1,27,2019/2/1,28,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。 rXX=P2TX 思考：相关系数的平方？,2019/2/1,29,2

8、019/2/1,30,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。 rXX=PXX,2019/2/1,31,A卷：你是一个喜欢热闹的人吗？,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,2019/2/1,32,B卷：你是一个喜欢安静的人吗？,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,2019/2/1,33,二、信度系数与信度指数,信度指数：相关系数信度系数：相关系数的平方注意：（1）信度系数有多种。（2）同一种信度系数也会因样本、测查时间不同而有多个。（3）信度系数只是对测量分数一致性的估计，但并没有指出不一致的原因。（4）获得较高的

9、信度只是测验有效的必要条件。,2019/2/1,34,三、信度的作用,1信度是测量过程中所存在的随机误差大小的反映 2信度可以用来解释个人测验分数的意义 SE=Sx1 rxx 真分数的置信区间（95%）=X1.96SE 3信度可以帮助进行不同测验分数的比较,2019/2/1,35,注意：信度参照的是测验分数或测量值，而非测验本身。测验由题目组成，而这些题目本身并不能提供信度的估计值。估计信度前必须先进行施测和计分。,2019/2/1,36,第二节信度的估计方法,一、重测信度(稳定系数) 1含义和计算同一量表，同一被试群体，在不同时间，两次施测，求其相关。皮尔逊积差相关系数 2使用的前提

10、条件所测量的心理特质必须是稳定的；(人格测验) 练习和遗忘的效果基本上相互抵消；在两次施测的间隔时期内，被试在所要测查的心理特质方面没有获得更多的学习和训练。,2019/2/1,37,3. 实质：表示测验结果的稳定性。故称之为稳定性系数（Coefficient of Stability） 4. 形式：施测适当时间再施测,2019/2/1,38,5. 时间间隔的把握一个校区每年都对学生进行IQ测验，而另一个校区则两年一次。第一个校区的老师可能认为IQ测验的分数在一年中会保持稳定，所以有必要进行再测，因为学生在一年后的回答可能不一致。第二个校区的老师则认为在一年中分数并没有明显的波动，那么施

11、测的频率没有必要高于两年一次。哪种结果正确呢？取决于第一年和第二年成绩的相关。通常来说，大约为0.80或0.90，且保持相对稳定（Bayley,1949）所以，频率没必要高于两年一次。,2019/2/1,39,间隔时间越长，稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的间隔不能太长。一般间隔时间不超过六个月。（即不能让被试记住上一次测验的内容，又不能让其特质发生变化，或对所学知识产生遗忘）适用于速度测验和人格测验,而不适用于难度测验.,2019/2/1,40,注意 : 同样一个量表

12、,随着第二次测量的时间不同,它可以有不同的重测信度,在报告重测信度时,要说明两次施测的间隔,以及在此期间内被试的有关经历。在中国修订韦氏儿童智力量表手册(C-WISC)中,就曾对重测信度的计算报告了被试情况(6-16岁城市儿童151名,农村儿童74名且各年龄儿童分配较均匀),并报告了两次测验的间隔(2-7周)及两次的相关系数(城市:0.59-0.86,农村:0.56-0.81)。,2019/2/1,41,二、复本信度 1含义和计算复本信度（Alternate-form reliability）是指两个平行的测验测量同一批被试所得结果的一致性程度。复本等值要符合下列条件：各份测验测量的

13、是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等，难度和区分度大体相同。各份测验的分数分布（平均数和标准差）大致相等。复本编好后，应再测一次，以确保各份测验的等值。,2019/2/1,42,2使用的前提条件两测验真正平行；被试要有条件接受两个测验。(时间,经费的限制) 等值性系数：同时连续施测，反映内容变异。形式：复本A最短时间复本B 稳定性与等值性系数：时间间隔施测，内容变异重测信度误差形式：复本A适当时间复本B,2019/2/1,43,3.缺点:,只能减少而不能完全排除练习和记忆的影响. 对许多测验来说,建立复本是相当困难

14、的. 4.误差来源: 测验的两种形式是否等值:测题取样是否匹配,格式是否相同,内容、题数、难度、平均数、标准差是否一致；被试方面情绪波动、动机变化等；测验情景的变化；偶发因素的干扰。,2019/2/1,44,三、分半信度,1含义和计算分半信度（split-half reliability）是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值，可将项目按由易到难的顺序排列编号，然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半，否则会使信度值偏高,20

15、19/2/1,45,分半信度（Split-Half Reliability）,被试在两半测验上得分的相关系数只是半个测验的信度，还必须用斯皮而曼布朗公式校正校正公式：斯皮尔曼-布朗公式 rxx= 2 rhh /（1+ rhh）但只能在两半测验分数的变异数（ sa2 、Sb2 ）相等时才能用。,2019/2/1,46,弗朗那根公式： rxx = 2 1 -（sa2 + Sb2）/ Sx2 卢仑公式： rxx = 1 - Sd2 / Sx2 2使用的前提条件,2019/2/1,47,例题：,100个题目，分半信度r.70，整个测验的估计信度是多少？,2019/2/1,48,四、同质性信度

16、,1.含义同质性指测验的所有题目测量的是同一种心理特质，表现为各个题目得分之间有较高的相关，相关越高则同质性越强。同质性信度（homogeneity reliability），也叫内部一致性系数，是指测验内部所有题目间的一致性程度。 2计算及适用范围 rxx = K rij / 1 +（K - 1）rij ,2019/2/1,49,KR20公式（仅适用于（0，1）记分的测验） rxx = K /（K - 1） 1-（piqi）/ Sx2 pi为答对第i题的人数的比例；qi为答错第i题的人数的比例。 K为题目数， Sx2为测验总分的变异。 KR21公式（所有题目难度接近时才适用） rxx = K /（K - 1） 1 -（K p q ）/ Sx2 ,2019/2/1,50,克龙巴赫系数（可处理任何内部一致性系数的计算问题

展开阅读全文