心理测量的总结 - 用于合并

kms****20

实名认证

店铺

DOC

89KB

约5页

文档ID:39911249

1/5页

点击查看更多>>

文本预览下载提示常见问题

综观心理测量的发展历史，可以看出以下几点趋势综观心理测量的发展历史，可以看出以下几点趋势1. 先以解剖生理特征为根据，而后转向心智活动的测量；2．由测量简单的感知能力，发展到测量复杂的认知能力； 3．由笼统的单一量数评定个别间的差异，转变为以多个量数兼顾个别差异与个别内差异；4．心理测量学是随着实验心理学的发展而产生的，二者在发展过程中由合到分，最后又走到一起来了心理测量的贡献与局限心理测量的贡献与局限贡献：首先，为心理科学理论的发展，特别是个体差异心理提供了具体方法和手段，构筑了差异心理理论的重要基石其次，心理测量为社会实践服务做出了巨大的贡献局限：首先，心理测量具有间接性，精确程度远远劣于物理测量其次，心理测量所依据的理论尚不完善第三，心理测验的编制比较复杂困难第四，心理测量仅仅是研究差异心理的手段方法之一，而不是唯一，对于人的复杂的心理应该是多种研究方法交叉使用，方可验证其真正的规律第五，心理测量的发展还要受政治、经济、文化等社会因素影响信度信度一、信度的定义一、信度的定义信度又叫可靠性指的是测量的一致性程度（操作定义）在测量理论中，信度被定义为：一组测验分数的真变异数（就是真分数方差）与总变异数（实测分数方差）的比率。

即 rxx=ST2 / Sx2 （真分数就是测量中不存在测量误差时的真值或客观值，操作定义就是无数次测量的平均数，实测分数=真分数+误差分数）  该定义有两点需要注意：该定义有两点需要注意：  第一、信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性；  第二、真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数做出估计二、信度系数二、信度系数 大部分的信度指标都以相关系数表示，即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标，称作信度系数（rxx ）  对信度系数要注意三点对信度系数要注意三点：： 第一，在不同情况下，对不同样本，采用不同方法会得到不同的信度系数；第二，信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因；第三，获得较高的信度系数并不是心理测量追求的最终目的，它只是使测验有效的一个必要条件 （仅供了解）（仅供了解）信度是一个理论上构想的概念，在实际应用时，通常以同一样本所得的两组资料的相关，作为测量一致性的指标因为测验分数的误差来源不同，估计信度的方法也不同，故每一种信度系数只能说明信度的不同方面，因而具有不同的意义。

下面介绍五种估计信度的方法重测信度重测信度：：用同一种测验，对同一组受试者，前后施测两次，再根据受试者两次测验分数计算其相关系数，即得再测信度此种信度能表示两次测验结果有无变动，反映测验分数的稳定程度，故又称稳定性系数计算重测信度的几个假设计算重测信度的几个假设１．所测量的特性必须是稳定的；２．遗忘与练习的效果相同；３．两次施测期间被试的学习效果没有差别误差来源误差来源 1. 测验本身：测验所测的特性本身就不稳定，例如情绪 2. 被试方面：成熟、知识的发展并非人人都等量增长，且练习因素、记忆效果也存在个体差异 3. 施测情境：偶发因素的干扰，如计时错误，情绪波动，健康状况，动机变化注意事项注意事项１．１．两次测验的时间间隔要适当最适宜的时距随测验目的、性质及被试特点而异；２．此方法适用于速度测验或人格测验，不适于难度测验；３．注意提高被试的积极性使用重测信度的优缺点使用重测信度的优缺点１．（优点）能提供有关测验结果是否随时间而变异的资料，可作为预测受测者将来行为的依据２．（缺点）容易受练习和记忆的影响，前后两次施测间隔的长短必须适度; 第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异复本信度：复本信度：根据一组被试在两个平行（等值）测验上的得分计算相关系数。

误差来源误差来源1. 测验两种形式是否等值：（1）测题取样是否匹配；（2）格式是否相同；（3）内容、题数、难度、平均数、标准差是否一致 2. 被试方面情绪波动、动机变化等 3. 测验情境的变化,偶发因素的干扰复本应符合以下条件：复本应符合以下条件： 1. 各份测验测量的是同一种心理特性；2. 各份测验具有相同的内容和形式； 3. 各份测验的题目不应有重复的地方； 4. 各份测验题目数量相等，并且有大体相等的难度、区分度； 5. 分数分布（平均数和差异度）大致相等 注意事项注意事项 1. 两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似； 2. 两次测验的时间间隔要适当，若太短，由于测验太相似被试可能厌倦，若太长可能又会因新的学习而产生干扰 使用复本信度的局限使用复本信度的局限1. 只能减少但不能完全消除练习和记忆的影响； 2. 由于第二个测验只改变了题目的具体内容，已经掌握的解题原则，可以很容易地迁移到同类问题 3. 对许多测验来说，建立复本是十分困难的分半信度：分半信度：在测验无复本且只能施测一次的情况下，通常用分半法估计信度，即将测题分成对等的两半，根据各人在这两半测验的分数，用皮尔逊积差相关公式计算其相关系数，作为信度指标。

分半的方法（分半的方法（仅供参考）仅供参考）通常采用奇偶分半法使用此方法应注意： 1．一组解决同一问题或互相有牵连的题目应尽量安排在同一半内 2．当试卷中有任选题时不宜使用分半法，速度测验也不宜用 （三）校正公式（因为此方法和可能低估原长测验的信度，因此需要用斯皮尔曼公式进行修正）（三）校正公式（因为此方法和可能低估原长测验的信度，因此需要用斯皮尔曼公式进行修正）1.斯皮尔曼—布朗公式 rxx=2rhh/（1+ rhh）其中，rhh 为两半分数的相关系数， rxx 为测验在原长度时的信度估计此法假设：两半测验分数的变异性相等，但实际资料未必符合此假设此法假设：两半测验分数的变异性相等，但实际资料未必符合此假设 同质性信度：同质性信度：同质性的含义：所谓同质性指的是测验内部题目的一致性题目内部的一致性主要受两方面变异的影响：1．内容的一致性； 2．所研究的行为的同质性 同质性信度的计算同质性信度的计算1．库德—理查逊公式：（1）K-R20 公式： rkk=[K/(K-1)][（Sx2-∑piqi )/ Sx2)]式中 K 表示整个测验的题数，pi 为项目通过率，qi 为项目未通过率，Sx2 表示测验总分的变异数（方差）。

（2）K-R21 公式，适用于各题难度相近的情况：rkk=[K/(K-1)][( Sx2-K piqi)/ Sx2]pi 为题目的平均通过率，qi 为 1-pi K-R21 公式计算较为简单，但求得的信度系数有低估的倾向，当题目难度相差大时偏差更大公式 K-R20 和 K-R21 只适用于 0，1 记分的测验 2．克伦巴赫 α 系数：适用于非 0，1 记分的一种内在一致性系数其公式如下：  α=[K/(K-1)][1-（∑Si2/ Sx2）] 其中 Si2 为每一项目分数的变异数，其他字母意义与 K-R20 相同评分者信度：评分者信度：是由多个评分者给一组测验结果评分，所得的各个分数的一致性方法是：随机抽取相当份数的试卷，由两位或多位评分者按记分规则分别给分，然后根据每份试卷的分数计算其相关系数，即得评分者信度一般要求在成对的受过训练的评分者之间平均一致性达到 0.90 以上，才认为评分是客观的 当多个评分者评多个对象，并以等级法记分时，可用肯德尔和谐系数作为评分者信度的估计：W=[∑Rt2-（∑Ri)2/N]/[(1/12)K2(N3-N)]（具体公式在书本 155 页）其中，K 是评分者人数，N 是被评的对象数，Rt 是每一个对象被评等级的总和。

影响信度的因素影响信度的因素 被试样本被试样本：：1，团体的异质性：，团体的异质性：信度系数受分数的分布范围（全距）的影响，而分数范围与被试团体的异质程度有关一个团体越异质，其分数范围越大，信度系数也就越高相反，相对同质的团体分数则较为均匀2，团体的平均水平：团体的平均水平：对于不同的团体，题目具有不同的难度每个题目在难度上的微小差异积累起来便会影响信度因此，我们在编制测验量表，抽选被试时，往往要考虑选取不同层次的被试，以使得测验团体呈异质性，从而使得信度提高反之，当需要同质团体的信度时，就应该尽量选取同一层次的被试 二、二、题目的数量题目的数量：一般说来，在一个测验中增加同质的题目，可以使信度提高即测验越长，信度越高这是因为测验加长，加大了分数分布的范围，可能改进项目取样的代表性，从而能更好地反映受测者的真实水平即测验的项目越多，在每个项目上的随机误差就可以互相抵消增加测验长度的效果可以用斯皮尔曼增加测验长度的效果可以用斯皮尔曼— 布朗的通式来计算布朗的通式来计算; rkk=Krxx/[1+(K-1)rxx]  式中式中 K 为改变后的长度与原来长度之比，为改变后的长度与原来长度之比，rxx 为原测验的信度，为原测验的信度，rkk 为测验长度是原来的为测验长度是原来的 K 倍时的信度估计。

倍时的信度估计  但增加测验长度的效果遵循报酬递减率，测验过长是得不偿失的，可以通过下式确定一个测验但增加测验长度的效果遵循报酬递减率，测验过长是得不偿失的，可以通过下式确定一个测验究竟要增长多少才能达到理想的信度水平：究竟要增长多少才能达到理想的信度水平：  K= rkk(1-rxx)/rxx(1- rkk) 应注意一点，只有当新题目是与原题目选自同一总体，增长测验才能改进信度应注意一点，只有当新题目是与原题目选自同一总体，增长测验才能改进信度 三、测验的难度三、测验的难度: 要使信度达到最高，能产生最广分数分布的难度水平方为合适通常这个难度为 0.5洛德提出选择题的理想平均难度是：五选题 0.70、四选题 0.74、三选题 0.77、是非题 0.85四、四、间隔时间间隔时间: 间隔时间越短，信度系数越大；间隔时间越长，受外界影响越大，信度系数越小 测量的标准误差测量的标准误差: 定义定义：：个人在两次测验中的分数差异就是测量误差，据此可制成误差分数的分布这个测量误差分布的标准差就是测量的标准误（SE ），是表示测量误差大小的指标. 测量标准误可以通过一次测验结果及信测量标准误可以通过一次测验结果及信度估计得到，公式如下：度估计得到，公式如下：SE = Sx√√1－－rxx 式中，式中，SE 为测量标准误，为测量标准误，Sx 为所得分数的标准差，为所得分数的标准差，rxx 为测验的信度。

由公式可知：为测验的信度由公式可知：测量的标准误与信度之间有互为消长的关系：信度越高，标准误越小；信度越低，标准误越大根据公式，知道了一组测量的标准差和信度系数，就可以求出测量的标准误，进一步我们就可以从每个人的实得分数估计出真分数的可能范围，即确定出在不同或然率水平上真分数的置信区间作用：作用：它有两个作用：其一是估计真分数的范围；其二是了解实得分数再测时可能的变化情况 （注意事项）（注意事项）第一、SE 对真分数作的是区间估计，不可能由此得到一个确切的点第二、置信水平确定后，估计的精确度主要取决于 SE ，SE 越小，估计就越精确，相反则越粗略第三、真分数不等同于真正能力或特质当系统误差对实测分数产生影响时，用此方法估计出的真分数就并非代表被试的真正能力或特质效度效度定义：定义：效度指的是测量的准确性，即一个测验或量具能够测量出其所要测量东西的程度（操作定义）在测量理论中，效度被定义为：。

下载提示

点击查看常见问题

相似文档

正为您匹配相似的精品文档