人才测评必要的理论基础

资源描述

《人才测评必要的理论基础》由会员分享，可在线阅读，更多相关《人才测评必要的理论基础（18页珍藏版）》请在金锄头文库上搜索。

1、研究者可以通过以下的方法来控制效标污染一是改变效度研究本身的设计二是采用部分相关的统计方法只有尽可能地控制效标污染才能更准确地了解测量工具和效标间的真实关系四信度和效度之间的关系根据前面所论述的信度和效度的定义和作用可以看出信度和效度所解决的是不同类型的误差问题信度是一致性的函数不管它是否射在靶心上只要是一种密集点状态就可以效度是准确性的函数在这里就是射中靶心周围点的函数失败的信度可以看作是一种随机误差失败的效度可以看作是一种系统误差缺乏信度或者效度的测量都是没有用的可见效度是测量的首要条件信度是效度的必要条件而非充分条件如果信度很低那么效度也不可能高因为如果测量的数据不

2、准确就不能有效地说明所研究的对象即使信度很高效度也未必高例如如果我们想测量一个人的数学能力但是测验是用文言文出题而这个人的文言文能力很差那么测量出来的结果是零分因为测量的方法不得当所以我们不能说这个人的数学能力很差这说明信度很高但是测量选择的方法是错误的所以效度不高第五节误差与常模一什么是误差误差是在测量中与目的元关的变量- 原因所产生的不准确或不一致效应任何测量都不是绝对准确的不准确的数据就有误差误差具有两层含义一是由与测量目的元关的变因引起二是不准确或不一致的测量结果二误差的种类一随机误差 random error 随机误差又称为可变误差它由与测量目的无关的偶然因

3、素例如外界环境测量本身难度等引起又不易控制使多次测量产生了不一致的结果二系统误差 systematic error 系统误差又称为恒定误差它由与测量元关的变量引起的一种恒定而有规律的误差稳定地存在于每一次测量中测值一致但不准例如在秤陀上搞鬼就形成了系统误差系统误差只影响测值的准确性与效度有关随机误差既影响准确性又影响一致性与效度和信度都有关三误差的来源一测验内部测量工具本身引起的误差这包括测验的题目较少没有代表性测验用词存在歧义测验题目格式设计不合理容易引起投机测验题目的难度不均偏高或者偏低答题时间过短等等二施测过程引起的误差一是物理环境如测试现场因为照明背

4、景音乐温度噪声通风桌椅和空间等不符合人体工程学使得被试感觉不舒服不能发挥正常的水平二是施测者的个体因素例如言行举止方面的误导或者干扰会影响被试的发挥三是评分者对于一些主观题目的评分缺乏客观统一的标准或者在评分过程中出现错误四是由于一些客观的突然因素发生例如生病停电测验用品突然出问题等三被试本身引起的误差被试由于焦虑生理经验等方面的因素也会导致测验的误差此外还有被试参加测试的动机以及个人的教育背景四常模 1常模的定义常模 norm 是一组被试样本的测验成绩的分布结构它是一种可以用来向其他测验结果进行比较的标准常模通常用集中趋势和离散程度来表示集中趋势通常用平均数 mea

5、n 来表示根据所学的数学和统计知识平均数是一个数列所有数之和除以数的个数的商离散程度通常用标准差 standard deviation 来表示数学上定义为一个数列各个数与平均数之差的平方和除以数的个数之商的平方根标准差越大说明数据分散的程度越大离散度就越大一个标准化的测评除了具有信度和效度外还需要对测评结果做出真实可靠的解释最常用的就是将被测对象的行为特征与某种标准相比较以确定其在群体中的水平而用来比较的标准就是常模 2常模的类型根据样本大小和来源通常有全国常模区域常模和特殊常模根据具体应用标准和分数特征可有平均数常模百分数常模标准分常模等等 3常模的作用常模的作用就是提供一

6、个科学可信的参照标准来说明某一测验成绩在同类被测对象中所处的水平例如在韦克斯勒智力测验中不同年龄阶段的个体就有不同的常模一个人答对了10道题不能立即判断他的智力水平程度而是要把他放到相应的同龄组去判断如果他是10岁一组年龄段的儿童和10岁组的常模比较他就达到了正常水平而如果他是6 岁以下的儿童那么对照相应的常模一比较他就是智力超常了由此可见常模是否有效可靠是一个很重要的问题在这里第一步就是关于常模的制定如我们需要测评现代经理人的人格特征最可靠最有效的办法当然是将所有经理人的人格特征一一加以测量然后求其平均数但实际上由于受到时间人力物力和财力等种种条件的限制我们只能测量具有这个研究特

7、征的一部分个体以它代表总体如果我们选择的某一部分的个体所组成的样组能够代表总体那么该样组就是标准化的样组按照标准化样组算出的平均数或标准差就是常模以此可以作为解释测验分数的参照点就能使测验分数具有意义数的相关系数t越大说明测评结果越可靠采用这种方法分析内在一致性信度的关键在于把一个测评一分为二不足随意的而应分成尽量等值的两半通常的做法是把题号为奇数的分作一半而题号为偶数的作为另一半那么信度系数rxx多高才是有意义的呢最理想的情况是rxx 1 00但是在实际的测量过程中这种情况很难达到通过参考同类的测验我们可以设立一些测量工具的信度系数的标准例如一般能力和学绩测验信度系数要在09以

8、上才能说测量的结果是有意义的对于个性和价值观等方面测验信度系数要介于075 -O 85之间一般来说当rxx 07时不能用测验来对个人做评价也不能在团体间做比较当rxx 0 75时可用于团体间的比较当rXX 085时可用于鉴别个人四影响信度的因素 1被试者的特征被试者的特征对信度的影响主要表现在被试者在测量属性方面的个体差异上如果一种测量工具对某种属性的测量得分的差别幅度越大那么该测量工具能区别开被测量的个体因而我们说该测量工具有较好的信度个体之间被测量的特征或者属性差别差异很小那么很难进行可靠的测量测验信度可能会很低可见被试自身的改变是误差它将会降低信度但是我们认为被试之间的差别是

9、真实差别这种差别产生了信度因此如果被试之间的方差或者个人真实差别增大而被试自身的变化保持不变这样就会提高信度然而在我们测量的过程中被试的个人之间的差别的幅度通常是无法控制的对于一个同质性比较强的群体来说信度系数为o 75的测量工具可以被接受但是对于一个异质性很强的群体来说这样的信度系数就不能被接受测量者在现选测量工具的时候参考相关的经验信度系数非常重要 2测验的长度和难度一般来说测量分数分布越广信度系数就相对越高这就好比让你来速记一组数字随着让你观察这组数字的时间的延长你会发现你能够描述的数字的准确性和详细程度也在不断提高一个给定的测验当增加测验的长度并且相应地延长测验的时间的时候也

10、会发生上述类似的效果 3不同信度测验方法的选择前面我们可以看到不同的信度测量方法处理测量误差的方式都不同这样在我们估计信度的过程中对不同方法的选择就会产生不同的估计值有些方法倾向于对信度范围做上限估计有些倾向于做下限估计这样针对不同特点的测验我们要学会选择估计方法 4测验过程中的误差测试现场因为照明背景音乐温度噪声通风桌椅和空间不符合人体工程学等原因导致被试精神和身体状况的不适或者被试由于不熟悉答题的样式答题经验的不足或者生病等突发状况的发生都会导致测量的误差二测量的效度一效度的含义和特性效度Validity即有效性它是指测量工具或手段能够准确测出所需测量的某素质特征的程

11、度效度是指所测量到的结果反映所想要考察内容的程度测量结果与要考察的内容越吻合则效度越高反之则效度越低或者简单地说是指一个测验的准确性有用性如果我们用体重秤来测身高显然这种测量工具的选择是不正确的所以说这个测量工具没有效度效度的操作定义是在一系列测量中与测量目的有关的真实变异数测量目的有关的有效变异与总变异数实得变异数的比率效度的性质 1效度具有相对性任何测验的效度是对一定的目标来说的或者说测验只有用于与测验目标一致的目的和场合才会有效所以在评价测验的效度时必须考虑效度测验的目的与功能 2效度具有连续性测验效度通常用相关系数表示它只有程度上的不同而没有全有或全无的区别效

12、度是针对测验结果的效标和效标测量效标即衡量测验有效性的参照标准指的是可以直接而且独立测量的我们感兴趣的行为我们感兴趣的行为就是要预测的行为这是一个总的观念故必须以可操作的测量来确定才有实际意义因此有必要把效标细分为两个层次其一是理论水平的观念效标其二是操作定义水平的效标测量常用的效标有 1学业成就如在校成绩学历有关的奖励和荣誉教师对学生智力的评定等常作为智力测验的效标也可作为某些多重能力倾向测验和人格测验的效标 2实际工作表现是最满意的效标测量为一般智力测验人格测验和一些能力倾向测验的效标 3特殊训练成绩 4精神病诊断 5等级评定是观察者根据测验欲测量的心理特质在被试身上的表现而作出

13、的一种个人判断 6效标团体的比较即找出两个在效标表现上有差别的团体比较他们在测验分数上的差别 7先前有效的测验一个新测验与先前有效的测验的相关也经常作为效度检验的证据二效度的类型根据效度评估方法不同效度分为内容效度构想效度和效标关联效三种类型 1内容效度 content validity 内容效度就是检验测验的内容对所要考核范围的代表性程度例如面试的时候对一个技术人员所掌握的技术水平的测验可以通过选取不同水平的具有代表性的技术问题来测量这样就能大致推断技术人员的技术水平内容效度指的是测验题目对有关内容或行为取样的适用性从而确定测验是否是所欲测量的行为领域的代表性取样不同于下面的两种效

14、度内容效度首先重点是强调新测量工具的建构而不是己有测量工具的效度设计并采用这种方法的目的是帮助确保测量工具的建构是针对所要测量的内容这种方法主要是依靠专家根据经验来判断一个测量工具的效度而不是依靠相关系数因此内容效度被称作一种描述性效度为了确保内容效度的客观可以通过以下的流程来保证 1对所测量的内容进行全面的分析尽可能地搜索到最齐全的资料 2挑选参与内容效度研究的专家这些专家应该能够承担相关测量范围的职责并且具有这些职责所具备的知识技术和能力 3瓢选测量内容 4评估颤选测量工具与被测量内容的相关性 2构想效度 construct-related validity 构想效度指测验能够测量

15、到理论上的构想或特质的程度即测验的结果是否能证实或解释某一理论的假设术语或构想解释的程度如何例如我扪根据理论的假设结构来编制一份心理测量量表或者测验如果实际测量结果所测得的实际分数经过统计检验能够有效地解释受试者的心理特质那么我们说这个量表或者测验具有良好的构想效度 3效标关联效度 criterion-related validity 1效标与效标测量效标是衡量一个测验有效性的参照标准效标测量就是将效标转化为某种可以操作的测量指标效标具有四个特性多样性复杂性特殊性时间性 2效标关联效度效标关联效度是指测验与外在效标间关联的程度即一个测验对处于特定情境中的个体行为进行预测时的有效性准

16、确性效标效度主要考虑的是测验分数与效标之间的关系效标关联效度根据使用时间间隔的长短又分为同时效度与预测效度同时效度 concurrent validity 是指收集效标材料与测验分数差不多同时进行例如有两个智力测验A和BA实施起来很费时间而B测验时间短如果B的成绩与A的成绩有很高的相关则B可以作为A的替代测验预测效度 predictive validity 是指收集效标材料在实际测量结束后隔一段时间再获得区分同时效度与预测效度的标准不是时间而是测验的目的前者主要用于测量现在的状态后者主要用于预测未来的情况例如入学考试成绩若能够很好地预测入学后的学习成绩的话这个入学考试的预测效度就高 3确定效标关联效度的方法 A相关法相关法是指计算测验结果分数与效标之间的相

展开阅读全文