《精编》人才测评的信度和效度

资源描述

《《精编》人才测评的信度和效度》由会员分享，可在线阅读，更多相关《《精编》人才测评的信度和效度（44页珍藏版）》请在金锄头文库上搜索。

1、人才测评的信度和效度第二节人事测量的信度一信度的定义1 信度指测量结果的可靠性或一致性测验量表或问卷必须具有较高的信度例如能力与学习成绩测验 0 90以上性格兴趣价值观测验 0 80以上 2 误差 1 抽样误差由抽样变动而造成的误差信度估计时抽样误差可以忽略不计 2 系统误差与测验目的无关的因子所引起的恒定的系统的有规律变化存在于每次测验中的误差系统误差与效度有关与信度无关 3 随机误差使用测量工具进行心理测量时所造成的误差无规律性测量误差与信度效度都有关信度则完全受测量误差的影响 3 信度考虑的问题 1 稳定性问题测验分数一致性的程度一个人的获

2、得分数与真实分数之间的接近程度测验的测量一致性是否可以达到实际应用的程度 2 影响稳定性的原因什么因素造成了这种误差这些效应的相对作用如何二信度的作用 1 信度的表示信度系数信度系数一般指同一样本所得的两组资料的相关信度系数的理论公式 rxx rxr2 ST2 SX2其中 ST是真实分数标准差 SX是实得分数标准差 rxr ST SX也称为信度指数 2 说明可以接受的信度水准一般的能力测验与成就测验信度系数应该在0 90以上人格兴趣等测验的信度系数通常应该在0 80 0 85之间当rxx0 7时可用于团体间的比较当rxx 0 85时可用于鉴别个人 1 解释真实分

3、数与实得分数的相关信度可以解释总方差中有多少比例是由真实分数的方差决定的信度系数告诉我们测量的误差比例是多少 2 信度的作用三信度的评定方法 1 重测信度 1 定义重测信度又称为稳定性系数用同一测验在不同时间对同一群体施测两次这两次测量分数的相关系数采用积差相关系数即为重测系数 2 重测信度所考察的误差来源时间的变化所带来的随机影响例如由气候偶然的噪音或其他干扰以及引起被试本身身心状态变化的因素如疾病疲劳情绪波动焦虑等原因造成的对测量结果的影响 3 注意问题重测间隔的时间重测信度一般只反映由随机因素导致的变化而不反映被试行为的长久变化不同的行为受随机

4、误差影响不同 4 适用范围解决问题型测验不适宜使用不大容易受重复影响的测验如感觉一运动测验或人格测验比较适合用重测法计算信度系数 2 复本信度 1 定义复本信度又称等值性系数它是以两个测验复本功能等值但题目内容不同来测量同一群体然后求得应试者在这两个测验上得分的相关系数积差相关 2 测验目的考察两个测验复本的题目取样或内容取样是否等值 3 测验方式同时施测实践中一半被试先做其中的一个复本另一半被试先做另一个复本不同时施测所测得的是重测复本信度更为严格 4 优缺点优点能够避免重测信度的一些问题如记忆效果练习效应等适用于进行长期追踪研究或调查某些干涉变

5、量对测验成绩影响减少了辅导或作弊的可能性局限性只能减少而不能消除练习的影响有些测验的性质会由于重复而发生改变有些测验很难找到合适的复本 3 内部一致性信度 1 定义主要反映测验内部题目之间的关系考察测验的各个题目是否测量了相同的内容或特质内部一致性信度分为分半信度和同质性信度 2 同质性信度定义所有测验题目测量的只是单一特质或内容表现为所有测验题目得分的一致性 3 分半信度定义通过将测验分成两半计算这两半测验之间的相关性而获得的信度系数方法在测验实施后将测验分为等值的两半并分别计算每位被试在两半测验上的得分再求出这两个分数的相关系数一般采用奇偶分半的方法

6、即将测验按奇数题和偶数题分成两半 4 评分者信度 1 定义不同评分者对同样对象进行评定时的一致性 2 方法最简单的估计方法就是随机抽取若干份答卷由两个独立的评分者打分再求每份答卷两个评判分数的相关系数 3 计算方法积差相关法斯皮尔曼等级相关法肯德尔和谐系数评分者在三人以上而且又采用等级记分四影响信度的因素 1 样本团体的性质样本团体的性质对信度的影响主要有以下三个方面 1 样本团体的分数分布任何以相关系数表示的信度系数都会受样本团体分数分布的影响分数分布越广信度系数就相对越高分数分布越窄信度系数就会越低 2 样本团体的异质性一般来说取样团体的异质性越大信度系数

7、就相对越高 3 不同团体间能力水平的差异 2 测验的长度题目的多少一般来说测验越长信度值越高一方面测验越长题目取样或内容取样就越充分结果就越可靠另一方面较长的测验也不容易受到猜测的影响 3 测验的难度天花板效应一个测验的难度太低测验分数会非常集中并聚在高分端地板效应测验难度太大所有分数都集中在低分端它们都会使测量到的分数分布太窄导致信度降低只有当测验的难度水平能够使测验分数分布范围最大时测验的信度才会比较理想一般来说当所有被试的平均分为测验总分的一半并且分数从零分到满分分布时测量的信度最高第三节人事测量的效度一效度的定义1 理论定义效度指

8、与测量目标有关的真实分数方差即由测量目标变量所产生的方差与总分方差的比率 rXY Sv2 SX2 Sv其中是有效方差 SX是总方差而SX2 ST2 SE2 SV2 SI2 SE2可见造成测验分数变化的原因出自三大来源测量对象本身的变化量具的精度造成的系统误差量具使用中造成的随机误差 2 信度和效度的关系 1 信度考虑的是随机误差的影响而效度的误差还包括系统误差例游标卡尺钢琴 2 信度是效度的必要条件效度高必然信度高但信度高并不保证效度必然会高效度的最大值是信度系数的平方根例磅秤测量身高南辕北辙 3 效度的性质 1 测验的效度指的是测量结果的效度即测量结果

9、的准确性程度 2 效度是连续的只有高低差别而非全有或全无变量 3 效度的高低是针对测量目标而言的 4 效度并非直接测量得到的而是从已有的证据推理而得的二效度评定的方法一内容效度1 定义检查测验内容是否是所要测量的行为领域的代表性取样的指标内容效度分析时要注意两方面的问题 1 应避免将测验取样的行为领域过于泛化 2 要注意测验分数中无关因素的影响 2 内容效度的评估方法 1 没有可用的数量化指标只能靠推理和判断评估 2 依赖条件测验内容范围明确测验内容的取样有代表性 3 确定方法通常是由专家根据测验题目和假设的内容范围作系统的比较判断也可间接借用其他统计指标说

10、明如评分者信度复本信度等确定内容效度的步骤 1 确定总体范围即描述有关的知识与技能及所用材料的来源 2 编制双向细目表确定内容和技能各自所占的比例并由测验编制者确定各题所测的是何种内容与技能 3 制定评定量表来测量测验的整个效度及其他特点 3 内容效度的应用 1 最适合于评估教育和职业成就测验内容效度的评价可以回答以下两个问题样本的代表性无关因素的影响程度 2 评价某些用于选拔和分类的人事测验 3 不适用于能力倾向测验和人格测验二效标关联效度效标效度 1 定义反映测验分数与外在标准效标的相关程度即测验分数对个体的效标行为表现进行预测的有效性程度效标关联效度往往

11、用于预测性测验这种测验中根据测验分数作出的预测一般用于甄选决策 2 效标关联效度的类型 1 预测效度定义反映由测验分数对任一段时间间隔后被试行为表现的预测程度适用范围对人员进行选拔分类和安置的人事测验 2 同时效度含义效标材料和测验分数同时搜集应用范围因为同时效度的评估不需要长期追踪所以应用比较普遍 3 同时效度和预测效度的差异测验目的不同前者多用于诊断现在的状态后者多预测未来的结果 3 效标和效标测量 1 效标衡量测验有效性的参照标准 2 效标测量可操作的测量指标 3 效标分类观念效标效标的实质概念内容效标测量即效标的具体度量方法 4 保证效标测量客

12、观性的要点避免偏见的影响特别是等级评定防止效标污染效标污染由于评定者知道测验分数而影响个人的效标成绩的情形 4 常用的效标 1 学术成就这种指标常作为智力测验的效标其逻辑假定是智力高以高IQ分数为标志的人其学术成就也应当越大相应的常见的效标测量有在校成绩学历标准成就测验分数教师对学生智力的评定工作中的研究成果有关的奖励和荣誉等也可以作为某些多重能力倾向测验和人格测验的效标 2 特殊训练成绩能力倾向测验被试在将来某种特殊训练中所取得的成绩多重能力倾向测验学校中类似课程的成绩 3 实际工作表现这种效标可用于起选拔作用的一般智力测验人格测验及能力倾向

13、测验等 4 团体对照方法用两个在效标表现上有差别的团体比较他们在预测源分数上的差别应用范围学业成绩或工作业绩人格测验团体对比法 5 等级评定这种评定往往由应试者的老师同学上级同事等观察者作出这种评定不局限于对应试者某种成就如工作绩效的评定也可以包括观察者根据测验所欲测量的心理特质在被评定者身上的表现而作出的一种个人判断评定可以作为任何测验的效标尤其适合人格测验因为人格测验的客观效标很难找到 6 先前有效的测验一个新测验和先前有效测验的相关也经常作为效度的证据当新测验只是现有有效测验的简式时后者的成绩完全可以作为一种效标测量纸笔测验可以用效度已知的操作

14、测验成绩作效标测量团体测验可用个体测验作为效标只有当新测验比先前公认的有效测验更简单更省时更经济时才能用后者作为效标三构想效度 1 定义测验的构想效度是指测验能够测量到理论上的构想或特质的程度所谓构想通常指一些抽象的假设性的概念或特质如智力创造力言语流畅性焦虑等这些构想往往无法直接观察但是每个构想都有其心理上的理论基础和客观现实性都可以通过各种可观察的材料加以确定构想效度关注的问题是测验是否能正确反映理论构想的特性 2 确定构想效度的步骤 1 建立理论框架以解释被试在测验上的表现 2 依据理论框架推演出各种有关测验成绩的假设 3 以逻辑和实证的方法来验

15、证假设根据这些累积材料决定这种理论是否能恰当地解释现有材料如果不能作出恰当解释则应该修正上述假设直到能作出恰当的解释为止 3 确定构想效度的一般方法 1 测验内部的方法如测验内容效度内部一致性等指标 2 测验间的方法如相容效度因素分析会聚效度和区分效度等指标 3 效标效度的研究如发展变化等指标 4 实验和观察方法检验是否有构想效度 4 确定构想效度的指标 1 发展变化智力测验中最常用的标准是年龄差异通常是考察实际年龄来观察测验分数是否逐年增加 2 与其他测验的相关 3 因素分析因素分析是分析行为资料内部关系结构特性的一种统计技术比较适合于对构想效度的研究通过因

16、素分析可以找出测验中所包含的特质 4 内部一致性用来考验内部一致性的方法主要有三种 i 考察总分数较高和较低两类人在各题目上通过率的大小比较每个题目上总分最高的27 的被试与总分最低的27 的被试如果前者在该题上的通过率显著大于后者一般要求在30 一40 以上则认为题目是有效的否则应淘汰或修改 ii 计算题目与总分的相关如未达显著水准应予淘汰 iii 求分测验与总分的相关在编制这种测验时常要求各分测验与总分有显著相关如果这一相关未达显著水平则应予删除 5 会聚效度和区分效度坎贝尔 D T Campbell 和费斯克 D W Fiske 1959年提出的构想效度的一种考验方法会聚效度一个测验与测量相同特质或构想等理论上有关的变量有高的相关区分效度一个测验与测量不同特质或构想等理论上不同的变量有低的相关三影响效度的因素一测验的因素1 测题中所用词汇和句型不能过于困难 2 试题的意思应该清楚 3 所编制的测题应该适合所要测量的学习结果 4 测题中不能提供额外线索 5 测题的编制要合理 6 选择题的正确答案不能有明显的组型 7 测题数目增加测题的数目

展开阅读全文