《人员素质评价第九章人员素质测评质量分析课件》由会员分享,可在线阅读,更多相关《人员素质评价第九章人员素质测评质量分析课件(30页珍藏版)》请在金锄头文库上搜索。
1、 第第1111讲讲 素质测评的质量分析素质测评的质量分析Hr-pkuHr-pku本讲内容本讲内容效度的概念及其分析方法效度的概念及其分析方法信度的概念及其分析方法信度的概念及其分析方法区分度的概念及其分析方法区分度的概念及其分析方法选题质量分析及其分析方法选题质量分析及其分析方法效度效度效度的概念效度的概念 效度是指测评结果对所测评素质反映的真实程度。对这种真实性效度是指测评结果对所测评素质反映的真实程度。对这种真实性的考评,常见的方法有三种:的考评,常见的方法有三种:从内容性质方面分析其内容效度从内容性质方面分析其内容效度从效标相关性方面分析其关联效度从效标相关性方面分析其关联效度从实证方面
2、分析其结构效度从实证方面分析其结构效度内容效度内容效度 是指实际测评到的内容与期望测评的内容的一致性程度。当实际是指实际测评到的内容与期望测评的内容的一致性程度。当实际测评到的内容与我们事先所想测评到的内容越一致时,则说明测测评到的内容与我们事先所想测评到的内容越一致时,则说明测评结果的内容效度越高,测评结果就越有效。评结果的内容效度越高,测评结果就越有效。 内容效度在实际操作中的鉴定主要采用定性分析的方法内容效度在实际操作中的鉴定主要采用定性分析的方法, , 有蓝图有蓝图对照分析法与专家比较判断法。对照分析法与专家比较判断法。结构效度结构效度结构效度又称作构想效度、构思效度、构念效度、构建效
3、度等。结结构效度又称作构想效度、构思效度、构念效度、构建效度等。结构效度是指实际所测评的结果与想测评素质的同构程度。它表明了构效度是指实际所测评的结果与想测评素质的同构程度。它表明了在多大程度上,实际测评结果能够被看作是索要测评的素质在结构在多大程度上,实际测评结果能够被看作是索要测评的素质在结构上的替代物。上的替代物。在素质测评中,它是人们最关心的一种效度。这是由素质测评的间在素质测评中,它是人们最关心的一种效度。这是由素质测评的间接性所决定的。人们总是通过选取一些具体的行为测评来判断实际接性所决定的。人们总是通过选取一些具体的行为测评来判断实际的素质水平。的素质水平。结构效度与检验效度的人
4、对素质结构的理解有直接关系。如果李某结构效度与检验效度的人对素质结构的理解有直接关系。如果李某认为忠诚这一素质即对本企业的忠诚,张某认为忠诚这一素质表现认为忠诚这一素质即对本企业的忠诚,张某认为忠诚这一素质表现为实事求是的态度,那么对于向其他企业说明本企业产品所存在的为实事求是的态度,那么对于向其他企业说明本企业产品所存在的问题这一行为,显然李某与张某会把它归类到不同的素质成分中给问题这一行为,显然李某与张某会把它归类到不同的素质成分中给与不同的素质成分中并给与不同的评价。因此结构效度的检验分析与不同的素质成分中并给与不同的评价。因此结构效度的检验分析也是一种定性的主观判断。在分析考评过程中,
5、要采取有力措施把也是一种定性的主观判断。在分析考评过程中,要采取有力措施把主观影响控制在最低点上。主观影响控制在最低点上。结构效度结构效度结构效度的分析可按一下几步进行:结构效度的分析可按一下几步进行:1.1.给所要测评的素质的结构模式下一个操作化的定义给所要测评的素质的结构模式下一个操作化的定义 “ “我们所要测评的素质是对我们所要测评的素质是对xxxx的态度、有关的态度、有关xxxx的品质、有关的品质、有关xxxx的的技能。技能。”像这样一些表述所测评素质的具体形象是什么,结构是像这样一些表述所测评素质的具体形象是什么,结构是什么,我们并不清楚,它仍然是从具体行为概括出某种意识或观什么,我
6、们并不清楚,它仍然是从具体行为概括出某种意识或观念,因此对结构效度的分析没有多大意义。这里的构建不是从行念,因此对结构效度的分析没有多大意义。这里的构建不是从行为向观念构建,而是相反,由观念向具体行为的构建。不是简单为向观念构建,而是相反,由观念向具体行为的构建。不是简单还原,而是在更高的水平上抓住所测素质的本质特征,确定一个还原,而是在更高的水平上抓住所测素质的本质特征,确定一个可感觉可操作的结构模式,由这种具体的结构模式作为抽象观念可感觉可操作的结构模式,由这种具体的结构模式作为抽象观念建构的替代物。这种替代物的成分显然应该是我们世纪能够看到建构的替代物。这种替代物的成分显然应该是我们世纪
7、能够看到的、听到的、感觉到的东西。例如:外显行为、客观性生理反应的、听到的、感觉到的东西。例如:外显行为、客观性生理反应等。素质测评的目标体系实际上就是所测素质的一个行为构建模等。素质测评的目标体系实际上就是所测素质的一个行为构建模型,这种结构模型分别由项目、指标、权重、标度等组成。这种型,这种结构模型分别由项目、指标、权重、标度等组成。这种模型的建构,在很大程度上取决于所测素质本身的特征及其抽象模型的建构,在很大程度上取决于所测素质本身的特征及其抽象程度等组成。程度等组成。要定义或建构一个素质的结构模型,可以从以下几方面着手:要定义或建构一个素质的结构模型,可以从以下几方面着手:首先,采取工
8、作分析方法,对所想测评的素质进行结构分析与行为首先,采取工作分析方法,对所想测评的素质进行结构分析与行为分析,确定各种素质结构及其代表的行为。分析,确定各种素质结构及其代表的行为。其次,用图表的形式逐一列出工作分析得到的素质因素及其特征行其次,用图表的形式逐一列出工作分析得到的素质因素及其特征行为。除此之外,还可以通过查找历史上或现在人们对所测评素质为。除此之外,还可以通过查找历史上或现在人们对所测评素质的模型的现成资料,丰富已有分析的结果。的模型的现成资料,丰富已有分析的结果。再次,还要另外准备一份与已经建构的模型可能混淆的但关系密切再次,还要另外准备一份与已经建构的模型可能混淆的但关系密切
9、的其他模型图表。要反问自己并向人说明为什么所测素质是你所的其他模型图表。要反问自己并向人说明为什么所测素质是你所定义的结构模型而不是其他别的结构模型。定义的结构模型而不是其他别的结构模型。2.2.收集事实资料,评判结构效度,具体方法有:收集事实资料,评判结构效度,具体方法有:排除法排除法 如果测评结果能明确的排除它所对应素质结构模型的其他解释,那就表如果测评结果能明确的排除它所对应素质结构模型的其他解释,那就表明所获得的测评结果具有较好的结构效度。明所获得的测评结果具有较好的结构效度。咨询法咨询法 可以请一些有经验的专家就你所获得的测评结果、所对应的素质结构进可以请一些有经验的专家就你所获得的
10、测评结果、所对应的素质结构进行判断或推断,问他们该测评结果实际测评的素质是什么。如果大家的行判断或推断,问他们该测评结果实际测评的素质是什么。如果大家的回答与你所想测评的素质结构几乎一致,那么说明你的测评有较好的结回答与你所想测评的素质结构几乎一致,那么说明你的测评有较好的结构效度。构效度。相关法相关法 找一个具有较高结构效度的测评工具或结果,与你所获得的测评结果进找一个具有较高结构效度的测评工具或结果,与你所获得的测评结果进行相关性分析,如果相关性很高,说明你的测评结果具有较高的结构效行相关性分析,如果相关性很高,说明你的测评结果具有较高的结构效度。度。 例如:某一个具有例如:某一个具有“自
11、尊自尊”结构效度的测评量表,它的测评结果就应该结构效度的测评量表,它的测评结果就应该与自信、社交能力及领导作用等测评量表的测评结果成正比,而与诸如与自信、社交能力及领导作用等测评量表的测评结果成正比,而与诸如内向性、自卑、孤独等测评量表测评的结果成反比。内向性、自卑、孤独等测评量表测评的结果成反比。逻辑分析法逻辑分析法 当大家对所测素质的结构模型具有比较一致的认识时,只要能判当大家对所测素质的结构模型具有比较一致的认识时,只要能判定测评内容(工具)选择正确,且整个测评过程除了一切外来干定测评内容(工具)选择正确,且整个测评过程除了一切外来干扰因素,就可以说测评结果具有较好的结构效度。扰因素,就
12、可以说测评结果具有较好的结构效度。 例如:测评时间足以保证被测评者完成所有的工作,被测评者没例如:测评时间足以保证被测评者完成所有的工作,被测评者没有受到催促因素的影响;测评工具的指导十分明确,被测操作准有受到催促因素的影响;测评工具的指导十分明确,被测操作准确。确。多元分析多元分析 多元分析就是采取聚类分析与主成分分析等数学手段,对测评结多元分析就是采取聚类分析与主成分分析等数学手段,对测评结果进行分析,看分析的结果。果进行分析,看分析的结果。 例如:所找出的主要因素与分类结果与所想测评素质的结构是否例如:所找出的主要因素与分类结果与所想测评素质的结构是否一致,如果一致,则说明所获得的测评记
13、过具有较好的结构效度。一致,如果一致,则说明所获得的测评记过具有较好的结构效度。关联效度关联效度又称实证效度、效标效度、效标关联效度,是指测评结果与效标又称实证效度、效标效度、效标关联效度,是指测评结果与效标的一致性程度。效标是一种用来衡测评有效性的外在参照标准的一致性程度。效标是一种用来衡测评有效性的外在参照标准, , 它可以是一种测评的结果它可以是一种测评的结果, , 也可以是标准测评分数。根据效标是也可以是标准测评分数。根据效标是否可以同时获得否可以同时获得, , 可将关联效度分为同时效度与预测效度。作为可将关联效度分为同时效度与预测效度。作为效标的结果与预测结果同时获得效标的结果与预测
14、结果同时获得, , 这种效度称之为同时效度。当这种效度称之为同时效度。当作为效标的结果是后来测评中获得作为效标的结果是后来测评中获得, , 这种效度称为预测效度。它这种效度称为预测效度。它反映了现在的测评结果对未来素质发展的预测程度。反映了现在的测评结果对未来素质发展的预测程度。 例如:两个人同时采用观察评定与问卷测验测评同一个人的工作例如:两个人同时采用观察评定与问卷测验测评同一个人的工作态度,两个测评结果相关系数很高,例如态度,两个测评结果相关系数很高,例如0.800.80,那么以后在类似,那么以后在类似的情况下,可以用问卷测验代替花时太多的行为观察法。的情况下,可以用问卷测验代替花时太多
15、的行为观察法。关联效度关联效度 例如想检测一下自编品德测评的效度,决定采用效标关联中的同例如想检测一下自编品德测评的效度,决定采用效标关联中的同时效度分析方法,故让被测者同时接受自编品德测验与卡特尔时效度分析方法,故让被测者同时接受自编品德测验与卡特尔16因素问卷测验。因素问卷测验。 关联效标的分析关键在于效标的选择。效标作为衡量测评结果有关联效标的分析关键在于效标的选择。效标作为衡量测评结果有效性的参照标准,应该是可以测评到且独立于所分析的测评结果效性的参照标准,应该是可以测评到且独立于所分析的测评结果的行为结果。效标可以分为行为效标与观念效标。的行为结果。效标可以分为行为效标与观念效标。
16、行为效标的选择以客观性为依据。常见的行为效标有以下几种:行为效标的选择以客观性为依据。常见的行为效标有以下几种:学术成就学术成就特殊训练成绩特殊训练成绩实际工作表现与成绩实际工作表现与成绩团体特征团体特征等级评定结果等级评定结果先前被证明是有效的测评结果先前被证明是有效的测评结果效度分析中的几个理论问题效度分析中的几个理论问题关于效度概念的研究关于效度概念的研究 19211921年年美美国国教教育育研研究究指指导导协协会会提提出出, ,效效度度是是“测测验验在在多多大大程程度度上上测测到到所所要要测测的的东东西西”。同同时时被被提提出出的的还还有有“预预测测效效度度”和和“共共时时效效度度”,
17、”,后来被统称为后来被统称为“效标效度效标效度”。1919世世纪纪3030年年代代, ,人人们们将将更更多多的的注注意意力力放放在在测测验验对对于于具具体体目目标标课课程程的的代代表性高低上。于是引入表性高低上。于是引入“课程效度课程效度”,”,后更名为后更名为“内容效度内容效度”。19541954年年美美国国心心理理学学会会出出版版了了关关于于心心里里测测验验和和诊诊断断的的技技术术建建议议书书,明明确确列列举举了了四四种种类类型型的的效效度度:预预测测效效度度、同同时时效效度度、构构想想效效度度、内内容容效效度度。美美国国心心理理学学会会、美美国国教教育育研研究究学学会会和和国国家家教教育
18、育测测量量委委员员会会19661966年年联联合合出出版版的的教教育育与与心心理理测测验验的的标标准准和和指指南南中中,将将效度类型进一步简化为效标关联效度、构想效度和内容效度三种。效度类型进一步简化为效标关联效度、构想效度和内容效度三种。和和又又进进一一步步把把前前两两类类归归结结为为准准则则关关联联效效度度。这这是是一一种种三三位位一一体体的的分分类类法法观观点点。指指出出, ,延延续续了了3030年年的的旧旧观观念念( (即即把把效效度度分分为为相相互互分分离离且且并并列列的的三三类类) )已已经经过时过时, ,取而代之的是一元论的产生。取而代之的是一元论的产生。以建构效度概念为中心以建
19、构效度概念为中心, ,提出了检验测验效度的四个提出了检验测验效度的四个层面层面( (渐进矩阵渐进矩阵) )。测试解释测试解释测验使用测验使用证据证据基础基础结构效度结构效度结构效度结构效度+ +适切性和适切性和实用性实用性后果后果基础基础结构效度结构效度+ +隐含的价隐含的价值值结构效度结构效度+ +适切性和适切性和实用性实用性+ +社会效果社会效果关于效度概念的研究关于效度概念的研究结结构构效效度度概概念念产产生生后后第第二二年年, ,. . .和和. . .提提出出了了5 5种种验验证证方方法法, ,即即分分组组区区分分法法、相相关关矩矩阵阵与与因因素素分分析法、内部结构研究、不同场合下的
20、变化研究、过程研究。析法、内部结构研究、不同场合下的变化研究、过程研究。DeborahLeeDeborahLee提提到到, ,效效度度指指的的是是一一个个测测验验准准确确测测量量它它所所要要测测的的东东西西的的能力能力, ,包括内容效度、效标关联效度和结构效度。包括内容效度、效标关联效度和结构效度。张张厚厚粲粲、孙孙晓晓敏敏、王王晶晶、叶叶映映华华、郑郑全全全全对对效效度度概概念念演演进进及及其其新新发发展展进进行行了了研研究究。张张厚厚粲粲、孙孙晓晓敏敏(孙孙晓晓敏敏、张张厚厚粲粲,20042004)回回顾顾了了心心理理测测量量学学中中效效度度概概念念发发展展的的三三个个阶阶段段, ,早早期
21、期效效度度概概念念关关注注的的是是两两个个变变量量之之间间的的相相关关. .随随后后重重点点转转向向效效度度的的多多种种类类型型, ,现现阶阶段段则则注注重重考考察察测测验验的的构构想想效效度度。总总之之, ,效效度度确确证证成成为为一一个个持持续续不不断断的的动动态态过过程程; ;在在这这个个过过程程中中, ,运运用用各各种种技技术术不不断断地地评评价价、质质疑疑和和检检查查由由测测验验分分数数所所作作推推论论和和解解释释的的有有效效性性成成为为心心理理与与教教育育测测量量研研究究中中不不可或缺的组成部分。可或缺的组成部分。关于效度概念的研究关于效度概念的研究关于结构效度的研究关于结构效度的
22、研究肯肯贝贝尔尔和和菲菲斯斯克克()对对构构想想效效度度的的考考验验办办法法进进行行了了研研究究(肯肯贝贝尔尔和和菲菲斯斯克克,19591959),19601960年年肯肯贝贝尔尔指指出出,要要确确定定一一个个测测验验的的构构想想效效度度,则则该该测测验验不不仅仅应应与与测测量量相相同同特特质质或或构构想想等等理理论论上上有有关关的的变变量量有有高高的的相相关关,也也应应与与测测量量不不同同特特质质或或构构想想等等理理论论上上有有关关的的变变量量有低的相关,前者称为会聚效度,后者称为区分效度。有低的相关,前者称为会聚效度,后者称为区分效度。聂聂建建中中、汤汤晓晓媚媚(聂聂建建中中、汤汤晓晓媚媚
23、,20062006年年5 5月月)对对结结构构效效度度的的发发展展演演变变进进行行了了综综述述,文文章章分分析析了了结结构构效效度度在在内内容容、验验证证方方式式和和威威胁胁因因素素这这三三方方面面所所发发生生的的变变化化, ,指指出出结结构构效效度度从从概概念念、内内容容到到与与其其他他效效度度的的关关系系上上都都发发生生了了微微妙妙的的变变化化, ,其其概概念念内内涵涵更更加加清清晰晰, ,涵涵盖盖内内容容更更加加广广泛泛, ,在在整整个个效效度度概概念念中中占占据据了了更更加加重重要要的的位位置置。同同时时, ,还还指指出出了了以以往往常常用用的的结结构构效效度度验验证证方方法法的的不不
24、足足, ,提提出出要要对对结结构构效效度度进行试前和实施阶段的理论验证。进行试前和实施阶段的理论验证。效度应用效度应用内内容容效效度度分分析析适适用用于于某某些些对对员员工工进进行行选选拔拔和和分分类类的的职职业业测测验验,舍舍恩恩菲菲尔尔特特、阿阿克克、柏柏尔尔森森(SchoenfeldtSchoenfeldt,Acker&Perlson,1976Acker&Perlson,1976)清清楚楚而而详详细细的的说说明明了了编编织织工工业业阅阅读读测测验验是是怎怎样样应应用用各各种种内内容容效效度度分分析析法法。在在编编制制联联邦邦政政府府和和州州政政府府公公务务员员测测验验时时,这这种种方方法
25、法得得到到了了广广泛泛的的采采用。用。郭郭庆庆科科(郭郭庆庆科科,20022002)对对各各种种效效度度的的应应用用进进行行了了分分析析,他他指指出出效效标标关关联联资资料料可可以以应应用用于于对对个个人人分分数数的的预预测测(包包括括简简单单回回归归法法、多多种种测测验验信信息息的的综综合合)、人人员员的的分分类类与与安安置置(人人员员分分类类的的性性质质、人人员员分分类的优点、差异效度)类的优点、差异效度)。 信度信度信度的概念信度的概念 信度是指测评结果所反映素质的准确性。对于这种准确性的考评信度是指测评结果所反映素质的准确性。对于这种准确性的考评目前大致有稳定系数、等值系数、分半系数、
26、内部一致系数、评目前大致有稳定系数、等值系数、分半系数、内部一致系数、评分一致性系数等。分一致性系数等。 以上几种信度都是针对常模参照测验而言的,标准参照测验中的以上几种信度都是针对常模参照测验而言的,标准参照测验中的信度计算通常使用分类一致性信度,这种信度的的常用估计方法信度计算通常使用分类一致性信度,这种信度的的常用估计方法是考察同一批被测者在两次是册或者复本测验中的分类是否一致。是考察同一批被测者在两次是册或者复本测验中的分类是否一致。标准参照测验中的信度也可以使用标准参照测验中的信度也可以使用K K系数计算,较分类一致性信度系数计算,较分类一致性信度在统计上更合理(在统计上更合理(Co
27、hen,1968;Aiken,1988Cohen,1968;Aiken,1988)。)。再测信度再测信度指以同样的测评与选拔工具指以同样的测评与选拔工具, , 按照同样的方法按照同样的方法, , 对于相同的对象对于相同的对象再次进行测评与选拔再次进行测评与选拔, , 所得先后结果的一致性程度。再测信度的所得先后结果的一致性程度。再测信度的计算一般采用皮尔逊积差相关系数。计算一般采用皮尔逊积差相关系数。个体的素质测评在测评过程中会涉及许多因素的影响,素质本身个体的素质测评在测评过程中会涉及许多因素的影响,素质本身有时也无法精确定义。我们常常把对个体测评结果的准确性检验,有时也无法精确定义。我们常
28、常把对个体测评结果的准确性检验,置于群体测评结果的相互关系中,转化为两次位置关系的一致性置于群体测评结果的相互关系中,转化为两次位置关系的一致性分析。当同一对象的测评结果以同样的测评方式再次获得后,其分析。当同一对象的测评结果以同样的测评方式再次获得后,其顺序位置关系变异很小时,则说明测评结果比较准确。顺序位置关系变异很小时,则说明测评结果比较准确。例如:在技能测评中李某的分数是,在全体被测者中排名第例如:在技能测评中李某的分数是,在全体被测者中排名第一,这到底准不准呢?我们再重复测评一次,结果李某的分数是一,这到底准不准呢?我们再重复测评一次,结果李某的分数是,还是排名第一,而且其他被测的位
29、置顺序变化很小,我们,还是排名第一,而且其他被测的位置顺序变化很小,我们就可以说第一次的技能测评结果很可靠。就可以说第一次的技能测评结果很可靠。复本信度复本信度复本信度测评结果相对另一个非常相同的测评结果的变异程度。复本信度测评结果相对另一个非常相同的测评结果的变异程度。“非常相同非常相同”一般以等值解释。所谓等值一般以等值解释。所谓等值, , 是指在测评内容、效是指在测评内容、效度、要求、形式上都与原测评一样度、要求、形式上都与原测评一样, , 其中一个测评可以看作是另其中一个测评可以看作是另一个测评的近似复写一个测评的近似复写, , 即复本。即复本。“变异程度变异程度”一般以它的反义词一般
30、以它的反义词“一致性一致性”解释。解释。因此复本信度实际上是一种用等值系数揭示的信度。等值系数即因此复本信度实际上是一种用等值系数揭示的信度。等值系数即为两组测评结果的相关系数。为两组测评结果的相关系数。一致性信度一致性信度一致性信度又称同质性信度,是一种常用的估计信度的方法,反一致性信度又称同质性信度,是一种常用的估计信度的方法,反映了测验题目与所测量内容的一致性程度。映了测验题目与所测量内容的一致性程度。一致性信度的计算公式主要有分半信度,主要采用斯皮尔曼一致性信度的计算公式主要有分半信度,主要采用斯皮尔曼- -布朗布朗修正公式计算;库德修正公式计算;库德- -理查逊公式和克伦巴赫理查逊公
31、式和克伦巴赫系数。系数。 如果被测在第一个项目上比其他人分数高,在第二个项目上又比如果被测在第一个项目上比其他人分数高,在第二个项目上又比其他人高,在第三个项目上也比其他人高相反另一其他人高,在第三个项目上也比其他人高相反另一个人在第一个项目上比其他人分数低,在第二个项目上又比其他个人在第一个项目上比其他人分数低,在第二个项目上又比其他人低,在第三个项目上也比其他人低那么毫无疑问,人低,在第三个项目上也比其他人低那么毫无疑问,我们会认为测评结果比较可靠。我们会认为测评结果比较可靠。评分者信度评分者信度评评分分者者信信度度指指多多个个测测评评者者给给同同一一组组被被测测样样组组进进行行评评分分的
32、的一一致致性性程程度。度。测测评评与与选选拔拔结结果果的的差差异异程程度度来来自自两两方方面面一一是是被被测测评评者者自自身身, , 二二是是被被测测评评者者及及其其测测评评。信信度度主主要要是是对对后后者者的的度度, , 测测评评者者及及其其测测评评的的无关差异越小无关差异越小, , 测评与选拔结果就越可靠。测评与选拔结果就越可靠。测测评评者者的的评评分分是是引引起起主主观观性性测测评评结结果果差差异异的的主主要要原原因因。客客观观性性测测评评是是利利用用计计算算机机评评分分, , 不不受受主主观观因因素素影影响响, , 不不存存在在评评分分误误差差。评评分者信度主要采用肯德尔和谐系数计算。
33、分者信度主要采用肯德尔和谐系数计算。速度测验的信度速度测验的信度速速度度测测验验是是指指那那种种由由于于时时限限很很紧紧或或题题目目很很多多使使被被试试不不可可能能全全部部完完成的测验。成的测验。以以上上介介绍绍的的几几种种信信度度都都是是针针对对常常模模参参照照测测验验而而言言的的,速速度度测测验验中中的的信信度度通通常常采采用用做做答答速速度度的的一一致致性性为为依依据据。可可以以使使用用重重测测法法和和复复本本法法,根根据据被被试试两两次次回回答答题题目目数数量量的的变变化化对对速速度度的的一一致致性性作作出出估估计。计。信度多高才算可靠信度多高才算可靠 对对人人事事测测评评中中信信度度
34、系系数数与与测测评评质质量量的的关关系系,以以下下给给出出了了几几种种心心理理测验的信度系数:测验的信度系数:测验类型测验类型信度信度低低中中高高成套成就测验成套成就测验0 066660 092920 09898学术能力测验学术能力测验0 056560 090900 09797成套倾向测验成套倾向测验0 026260 088880 09696客观人格测验客观人格测验0 046460 085850 09797兴趣问卷兴趣问卷0 042420 084840 09393态度量表态度量表0 047470 079790 09898各种信度系数应用各种信度系数应用 信度系数类型信度系数类型估计方法估计方法
35、应用应用稳定性系数稳定性系数重测法(积差相关)重测法(积差相关)人格、速度测验人格、速度测验等值性系数等值性系数复本法(积差相关)复本法(积差相关)智力、学绩、速度测验智力、学绩、速度测验等值稳定性系数等值稳定性系数复本法(积差相关)复本法(积差相关)智力、学绩、人格测验智力、学绩、人格测验内部一致性系数内部一致性系数分分半半法法(积积差差相相关关,用用斯斯- -布布公公式校正)式校正)库德尔库德尔- -理查森公式法理查森公式法系数法系数法智力、学绩、选拔测验智力、学绩、选拔测验评分信度系数评分信度系数斯皮尔曼等级相关法斯皮尔曼等级相关法肯德尔和谐系数法肯德尔和谐系数法作作文文、创创造造力力、
36、投投射射、道德判断测验道德判断测验项目分析项目分析适合度适合度 在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们无难易之分,适合度指的是被测者行为符合项目测评点(指标),它们无难易之分,适合度指的是被测者行为符合项目测评标准的程度。当项目为试题时,适合度即难度;当项目是问卷中的问题标准的程度。当项目为试题时,适合度即难度;当项目是问卷中的问题时,符合度即所有选对的被测者人数与总人数之比;当项目为观察评定时,符合度即所有选对的被测者人数与总人数之比;当项目为观察评定量表中的指标时,符合程度即所有被测得分平
37、均值与指标满分值之比。量表中的指标时,符合程度即所有被测得分平均值与指标满分值之比。区分度区分度 又称鉴别力,指项目得分对被试实际能力或心理特质水平的区分能力或又称鉴别力,指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力,也即项目得分的高低与被试实际能力或心理特质水平高低的一鉴别力,也即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。项目区分度的计算方法主要有相关分析法(包括积差相关法、致性程度。项目区分度的计算方法主要有相关分析法(包括积差相关法、二列相关法和点二列相关法)、极端组法(鉴别度指数、临界比)和因二列相关法和点二列相关法)、极端组法(鉴别度指数、临界比)和因素
38、分析法素分析法独立性独立性 在能力在能力测评中,常常需要中,常常需要项目之目之间有一定的独立性。所有一定的独立性。所谓独立性即非相独立性即非相关性或低相关性。独立性的分析一般采用关性或低相关性。独立性的分析一般采用项目目间分数的相关系数揭示,分数的相关系数揭示,根据根据实际得分分布是否均匀,可以分得分分布是否均匀,可以分别采用采用rr系数法和列系数法和列联表表检验法。法。 项目分析项目分析选项质量选项质量对于诱答或正答质量的分析方法有两种:对于诱答或正答质量的分析方法有两种:诱惑力分析法诱惑力分析法 这种方法是采用表格形式,分别统计高分组与低分组中的被测者这种方法是采用表格形式,分别统计高分组
39、与低分组中的被测者对同一项目各选项的选择次数。对同一项目各选项的选择次数。“白智白智”试测法试测法 这种方法是找一些对测验内容一无所知或十分陌生的人作为被测这种方法是找一些对测验内容一无所知或十分陌生的人作为被测者进行测试,通过分析这些人对每个诱答选择的人次来分析选项者进行测试,通过分析这些人对每个诱答选择的人次来分析选项的质量。的质量。其他指标的分析其他指标的分析客观性客观性 测评的客观性由测评方法的客观性与测评者的客观性两方面构成测评的客观性由测评方法的客观性与测评者的客观性两方面构成总体分布与水平总体分布与水平 总体分布指测评结果在各水平层次上的分布情况,总体水平一般指对测评总体分布指测
40、评结果在各水平层次上的分布情况,总体水平一般指对测评结果集中量的分析。结果集中量的分析。区分性与差异性区分性与差异性 测评工具的区分性是指把不同水平的被测者区分开来的程度,测评区分性测评工具的区分性是指把不同水平的被测者区分开来的程度,测评区分性一般通过测评结果差异性的分析来揭示。一般通过测评结果差异性的分析来揭示。误差误差 误差是指通过测评结果的定性定量分析,判断测评结果是否受到心理效误差是指通过测评结果的定性定量分析,判断测评结果是否受到心理效应的严重影响。分析的主要内容是心理误差、标准误差以及单个测评结应的严重影响。分析的主要内容是心理误差、标准误差以及单个测评结果的致信区间。果的致信区
41、间。其他指标的分析其他指标的分析误差误差 心理误差心理误差哈罗效应误差哈罗效应误差哈罗效应又称晕轮效应,是指测评者往往会因为对被测评者整体印象哈罗效应又称晕轮效应,是指测评者往往会因为对被测评者整体印象的好坏从而影响他对每个素质的测评。例如因看到一个人相貌端庄、的好坏从而影响他对每个素质的测评。例如因看到一个人相貌端庄、严肃,就容易产生此人责任感很强的看法。由哈罗效应引起的误差严肃,就容易产生此人责任感很强的看法。由哈罗效应引起的误差叫哈罗效应误差。叫哈罗效应误差。哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,所谓一
42、好百好,一丑白丑。虽然这是一种泛化影响,而前者是响,所谓一好百好,一丑白丑。虽然这是一种泛化影响,而前者是一种演绎影响。一种演绎影响。趋中心理误差趋中心理误差趋中心理误差是指因为测评者既不愿把被测评的过好,也不愿把被测趋中心理误差是指因为测评者既不愿把被测评的过好,也不愿把被测评的过差而过于集中在中间段而产生的误差。这种误差使有差异的被测评的过差而过于集中在中间段而产生的误差。这种误差使有差异的被测得到相同或相近的分数,缺乏区分性。可以通过测量结果的分布及差异得到相同或相近的分数,缺乏区分性。可以通过测量结果的分布及差异量分析来揭示这种误差的情况。量分析来揭示这种误差的情况。宽大心理误差宽大心
43、理误差宽大心理误差指因测评者不坚持测评的标准要求就高不就低的测评而产宽大心理误差指因测评者不坚持测评的标准要求就高不就低的测评而产生的误差。这种误差表现为皆大欢喜,高分低能。另一种负向宽大心理生的误差。这种误差表现为皆大欢喜,高分低能。另一种负向宽大心理误差,则是过于严格,以一些脱离实际的高标准去测评人的素质,测评误差,则是过于严格,以一些脱离实际的高标准去测评人的素质,测评结果普遍较低。结果普遍较低。逻辑误差逻辑误差逻辑误差指测评者不是实事求是的对每个素质独立地测评,而逻辑误差指测评者不是实事求是的对每个素质独立地测评,而是依据其是否相关的特点而进行逻辑上的推断。是依据其是否相关的特点而进行
44、逻辑上的推断。对比效应误差对比效应误差对比效应误差指测评者在测评过程中因被测与标准间存在某种明对比效应误差指测评者在测评过程中因被测与标准间存在某种明显的反差而产生的误差。这种误差又叫托衬效应误差。显的反差而产生的误差。这种误差又叫托衬效应误差。例如鹤立鸡群,绿叶丛中一点红。例如鹤立鸡群,绿叶丛中一点红。接近效应误差接近效应误差接近效应误差是指测评者往往会把在时间、内容、形状等特征相接近效应误差是指测评者往往会把在时间、内容、形状等特征相似或相近的两个对象,给以同样的评价,而不论他们实际上是否似或相近的两个对象,给以同样的评价,而不论他们实际上是否有差别。有差别。例如某个素质低的人夹杂在两个素质好的人之间,其测评分数就例如某个素质低的人夹杂在两个素质好的人之间,其测评分数就容易偏高,相反,一个素质高的人夹杂在两个素质好的人之间,容易偏高,相反,一个素质高的人夹杂在两个素质好的人之间,他的分数就有可能偏低。他的分数就有可能偏低。谢谢大家谢谢大家!