《精编》人员测评系统的构建与效度信度检验

资源描述

《《精编》人员测评系统的构建与效度信度检验》由会员分享，可在线阅读，更多相关《《精编》人员测评系统的构建与效度信度检验（44页珍藏版）》请在金锄头文库上搜索。

1、第四章人员测评系统的构建与效度信度检验本章内容人员测评系统的构建与效度信度检验 1 测评系统的构成2 测评的效度3 测评的信度4 信度与效度的关系及提升策略一测评系统的构成人员测评过程测评考官根据岗位需要运用测评工具对被测人员施以刺激被测人员对此刺激做出反应测评考官对被测人员的反应情况进行度量与评价测评考官测评工具被测人员测评考官测评体系的主体是决定人员测评能否成功的关键要素在我国测评考官分三类具有人员测评专门知识的专门人士咨询师高校教师研究人员从事人力资源管理实务的专业人士 HR 人员使用部门的资深人士主管或骨干测评考官应具备的基本素质良好的个人

2、品格和道德修养测评组织方面的知识程序公平和与测评内容相关的知识评分公平测评技巧无领导小组讨论中的座位摆放面试中随机场景的设置等工作经验和社会经验经验直觉判断测评工具与方法能力测验一般能力特殊能力成就测验知识测验工作样本测试人格量表自陈式量表面试结构化非结构化评价中心针对管理者书面信息分析申请表履历表人事档案推荐信测评客体被测人员测评焦虑测评前训练针对测评的项目做大量的强化练习适应性训练认识技能训练要实现人职匹配就要对其全过程进行监控监控的依据和标准主要是测评的效度和信度二测量的信度一信度 reliability 一信

3、度的概念是测量结果的一致性 consistency 或者稳定性 sta bility 程度也就是研究者对相同或者相似的测量对象进行不同形式或不同时间的测量所得结果的一致性程度在测量理论中信度是指一组测验分数的真变异数与总变异数的比率在实际应用中它通常以同一样本所得的两组资料的相关作为测量一致性的指标信度能够回答测量工具是否稳定测量结果是否可以推论也就是概化能力即从一次测量来推论总体的正确程度我们可以举例说明信度的问题如果想知道某人的体重我们可以叫两个人来估计一个人的估计为150镑另一个人的估计为300镑那么我们就可以认为叫别人来估计体重是非常不可信的方法如果

4、用磅秤连续测量两次的结果都是相同的因而我们可以说在测量体重方面用磅秤的方法要比叫人来估计更可信例如果想知道一个人的智商首先我们请对这个人熟悉的两个老师来估计一个人的估计为110 另一个人的估计为150 显然这种巨大的差距说明叫人来估计智商是非常不可信的方法但是用智力测量量表连续测量两次的结果差别却很小因而我们可以说在测量智商方面用智力测量量表的方法要比叫人来估计具有更高的信度在人员测评的过程中应该选择具有较高信度的测量工具这样才能保证测量结果的可靠性信度就是对随机误差的一种测量随机误差决定了信度的高低二信度的种类由于误差来源的不同对信度的测量也

5、有不同的方法具体有以下三种不同的信度类型和相应的评估方法 1 再测信度 test retestreliability 与时间有关又称为稳定性系数它是指对同样的一个测验在不同的时间对相同的群体测量两次这两次测量的分数的相关系数就是再测信度我们通过再测信度的相关系数可以了解测量结果在经过一段时间后的稳定程度再测信度的两次测评使用的是同一个测评工具同一种测评方式但较难把握的是两次测评间隔的时间长短时间间隔过长被测者特征将随时间的增加而发展变化由此计算的稳定系数将失去意义若时间间隔过短又可能产生记忆与练习效应这也将影响稳定系数 2 与测评内容有关的信度单个项目的信度组成信度

6、内部一致性信度主要关注的是测验内部题目之间的关系它所考虑的问题是一个测量工具所有的维度测量的均一性折半信度将一份测验按照一定的方法分成尽可能平行的两个半份测验例如按照奇偶分半然后计算两半之间的相关得到的相关系数即为折半信度系数复本信度 3 与评分者有关的评分者信度相关系数法随机抽取若干份答卷有两个以上独立的评分者打分再求每份答卷两个评判分数的相关系数概化系数和可靠性系数相对误差概化系数常模参照测评绝对误差可靠性系数标准参照测评三影响信度的因素 1 被试者的特征被试者的特征对信度的影响主要表现在被试者在测量属性方面的个体差异上如果一种测量工具对某种属性的

7、测量得分的差别幅度越大那么该测量工具能区别开被测量的个体因而我们说该测量工具有较好的信度个体之间被测量的特征或者属性差别差异很小那么很难进行可靠的测量测验信度可能会很低 2 测验的长度和难度一般来说测量分数分布越广信度系数就相对越高这就好比让你来速记一组数字随着让你观察这组数字的时间的延长你会发现你能够描述的数字的准确性和详细程度也在不断提高一个给定的测验当增加测验的长度并且相应地延长测验的时间的时候也会发生上述类似的效果 3 不同信度测验方法的选择前面我们可以看到不同的信度测量方法处理测量误差的方式都不同这样在我们估计信度的过程中对不同方法的选择就会产生不同的

8、估计值有些方法倾向于对信度范围做上限估计有些倾向于做下限估计这样针对不同特点的测验我们要学会选择估计方法 4 测验过程中的误差测试现场因为照明背景音乐温度噪声通风桌椅和空间不符合人体工程学等原因导致被试精神和身体状况的不适或者被试由于不熟悉答题的样式答题经验的不足或者生病等突发状况的发生都会导致测量的误差三测量的效度一效度的含义和特性效度 Validity 即有效性它是指测量工具或手段能够准确测出所需测量的某素质特征的程度效度是指所测量到的结果反映所想要考察内容的程度测量结果与要考察的内容越吻合则效度越高反之则效度越低或者简单地说是指一个测验的准确性

9、有用性如果我们用体重秤来测身高显然这种测量工具的选择是不正确的所以说这个测量工具没有效度测评过程测评工具的研制计分和指导语的标准化被试作答反应主试或评分者测验的实施数据整理统计分析结果的解释每一步都要保证其科学性和准确性这样才能保证测量的结果和结论是有效而正确的效度的性质1 效度具有相对性任何测验的效度是对一定的目标来说的或者说测验只有用于与测验目标一致的目的和场合才会有效所以在评价测验的效度时必须考虑效度测验的目的与功能 2 效度具有连续性测验效度通常用相关系数表示它只有程度上的不同而没有全有或全无的区别效度是针对测验结果的效标和效标测

10、量效标即衡量测验有效性的参照标准指的是可以直接而且独立测量的我们感兴趣的行为我们感兴趣的行为就是要预测的行为这是一个总的观念故必须以可操作的测量来确定才有实际意义因此有必要把效标细分为两个层次其一是理论水平的观念效标其二是操作定义水平的效标测量常用的效标有 1 学业成就如在校成绩学历有关的奖励和荣誉教师对学生智力的评定等常作为智力测验的效标也可作为某些多重能力倾向测验和人格测验的效标 2 实际工作表现是最满意的效标测量为一般智力测验人格测验和一些能力倾向测验的效标 3 特殊训练成绩 4 精神病诊断 5 等级评定是观察者根据测验欲测量的心理特质在被试

11、身上的表现而作出的一种个人判断 6 效标团体的比较即找出两个在效标表现上有差别的团体比较他们在测验分数上的差别 7 先前有效的测验一个新测验与先前有效的测验的相关也经常作为效度检验的证据二效度的类型根据效度评估方法不同效度可以从六个角度来划分内容反应过程内部结构与其他变量的关系测验结果 1 内容效度 contentvalidity 内容效度就是检验测验的内容对所要考核范围的代表性程度例如面试的时候对一个技术人员所掌握的技术水平的测验可以通过选取不同水平的具有代表性的技术问题来测量这样就能大致推断技术人员的技术水平内容效度指的是测验题目对有关内容或行为取样的适用性

12、从而确定测验是否是所欲测量的行为领域的代表性取样目的构念构念具体化确定测评内容不同于其他几种效度内容效度首先重点是强调新测量工具的建构而不是己有测量工具的效度设计并采用这种方法的目的是帮助确保测量工具的建构是针对所要测量的内容这种方法主要是依靠专家根据经验来判断一个测量工具的效度而不是依靠相关系数因此内容效度被称作一种描述性效度为了确保内容效度的客观可以通过以下的流程来保证 1 对所测量的内容进行全面的分析尽可能地搜索到最齐全的资料 2 挑选参与内容效度研究的专家这些专家应该能够承担相关测量范围的职责并且具有这些职责所具备的知识技术和能力 3 瓢选测量内容

13、 4 评估颤选测量工具与被测量内容的相关性 2 基于反应过程的效度3 基于内部结构的效度建构效度建构效度指测验能够测量到理论上的构想或特质的程度即测验的结果是否能证实或解释某一理论的假设术语或构想解释的程度如何例如我扪根据理论的假设结构来编制一份心理测量量表或者测验如果实际测量结果所测得的实际分数经过统计检验能够有效地解释受试者的心理特质那么我们说这个量表或者测验具有良好的建构效度 3 基于与其他变量的关系的效度效标关联效度 criterion relatedvalidity 1 效标与效标测量效标是衡量一个测验有效性的参照标准效标测量就是将效标转化为某种可以操作的测量指

14、标效标具有四个特性多样性复杂性特殊性时间性 2 效标关联效度效标关联效度是指测验与外在效标间关联的程度即一个测验对处于特定情境中的个体行为进行预测时的有效性准确性效标效度主要考虑的是测验分数与效标之间的关系效标关联效度根据使用时间间隔的长短又分为同时效度与预测效度同时效度 concurrentvalidity 是指收集效标材料与测验分数差不多同时进行多用于对现有员工的测评例如有两个智力测验A和B A实施起来很费时间而B测验时间短如果B的成绩与A的成绩有很高的相关则B可以作为A的替代测验预测效度 predictivevalidity 是指收集效标材料在实际测量结

15、束后隔一段时间再获得多用于人员选拔和配置等工作区分同时效度与预测效度的标准不是时间而是测验的目的前者主要用于测量现在的状态后者主要用于预测未来的情况例如入学考试成绩若能够很好地预测入学后的学习成绩的话这个入学考试的预测效度就高 3 确定效标关联效度的方法A 相关法相关法是指计算测验结果分数与效标之间的相关得到的结果为效度系数计算效度系数常用的相关方法是积差相关又叫皮尔森 Pearson 相关要使用积差相关必须同时具备如下两个条件两个变量都是由测量获得的连续性数据即等距或等比数据两个变量的总体都呈正态分布或接近正态分布一般来说相关系数必须达到统计上的显著水平如

16、果其他情况己定那么效度系数越高越好 B 区分度区分度是指预测源分数是否能区分由效标测量所定义的群体操作方法是选取两种效标A和B 先根据A将群体区分开来再用B将群体区分开来根据两种效标区分的结果来判断如果A和B区分的结果一致那么说明效度较高 C 命中率命中率是根据测验所做的正确决定的比率它主要用作取舍决策某种测量工具的效度高不高主要是看做的决定是否与实际一致这就是命中率的高低命中率包括有总命中率正命中率负命中率对于测验的效果从图2 2中可以更直观地理解在左下角的正确拒绝区域中我们可以看出这部分的被试是属于工作成绩和测验分数都很低的被试群体所以拒绝这些被试是正确的左上角的区域是工作成绩高但是测验分数却相对较低的被试群体这里如果拒绝了显然是错误的右下角的区域是属于工作成绩低但是测验分数却相对较高的被试群体如果录取了他们显然是错误的右上角的区域是工作成绩高而且测验分数也高的被试群体录取他们显然是正确的 5 基于测评结果的效度统计结论效度衡量对测评数据进行分析时所用程序与方法的有效性的指标重点是测评本身的质量和统计方法的恰当性内部效度

展开阅读全文