第9章测评质量检测

上传人:大米 文档编号:568448026 上传时间:2024-07-24 格式:PPT 页数:25 大小:194.51KB
返回 下载 相关 举报
第9章测评质量检测_第1页
第1页 / 共25页
第9章测评质量检测_第2页
第2页 / 共25页
第9章测评质量检测_第3页
第3页 / 共25页
第9章测评质量检测_第4页
第4页 / 共25页
第9章测评质量检测_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《第9章测评质量检测》由会员分享,可在线阅读,更多相关《第9章测评质量检测(25页珍藏版)》请在金锄头文库上搜索。

1、 第第9 9章章 测评质量检测测评质量检测本讲内容本讲内容p效度的概念及其分析方法效度的概念及其分析方法p信度的概念及其分析方法信度的概念及其分析方法p区分度的概念及其分析方法区分度的概念及其分析方法p选题质量分析及其分析方法选题质量分析及其分析方法第一节第一节 效度效度p效度的概念效度的概念 效度是指测评结果对所测评素质反映的真实效度是指测评结果对所测评素质反映的真实程度。对这种真实性的考评,常见的方法有三程度。对这种真实性的考评,常见的方法有三种:种:从内容性质方面分析其从内容性质方面分析其内容效度内容效度从效标相关性方面分析其从效标相关性方面分析其关联效度关联效度从实证方面分析其从实证方

2、面分析其结构效度结构效度一、内容效度一、内容效度p定义定义 是指实际测评到的内容与期望测评的内容的一致性程度。是指实际测评到的内容与期望测评的内容的一致性程度。当实际测评到的内容与我们事先所想测评到的内容越一致时,当实际测评到的内容与我们事先所想测评到的内容越一致时,则说明测评结果的内容效度越高,测评结果就越有效。则说明测评结果的内容效度越高,测评结果就越有效。p分析方法分析方法 内容效度在实际操作中的鉴定主要采用定性分析的方法内容效度在实际操作中的鉴定主要采用定性分析的方法, , 有蓝图对照分析法有蓝图对照分析法( (看实际测评内容与蓝图的适合性看实际测评内容与蓝图的适合性)与专)与专家比较

3、判断法。(家比较判断法。( -1 -1 C C 1,C越大说明内容效度越高)持肯定判断的人数判断总人数二、结构效度二、结构效度p结构效度又称作结构效度又称作构想效度、构思效度、构念效度、构建构想效度、构思效度、构念效度、构建效度效度等。结构效度是指实际所测评的结果与想测评素质等。结构效度是指实际所测评的结果与想测评素质的同构程度。它表明了在多大程度上,实际测评结果能的同构程度。它表明了在多大程度上,实际测评结果能够被看作是所要测评的素质在结构上的替代物。够被看作是所要测评的素质在结构上的替代物。p在素质测评中,它是人们在素质测评中,它是人们最关心最关心的一种效度。这是由素的一种效度。这是由素质

4、测评的间接性所决定的。人们总是通过选取一些具体质测评的间接性所决定的。人们总是通过选取一些具体的行为测评来判断实际的素质水平。的行为测评来判断实际的素质水平。二、结构效度二、结构效度p结构效度与检验效度的人对素质结构的理解有直接关系。结构效度与检验效度的人对素质结构的理解有直接关系。如果李某认为忠诚这一素质即对本企业的忠诚,张某认如果李某认为忠诚这一素质即对本企业的忠诚,张某认为忠诚这一素质表现为实事求是的态度,那么对于向其为忠诚这一素质表现为实事求是的态度,那么对于向其他企业说明本企业产品所存在的问题这一行为,显然李他企业说明本企业产品所存在的问题这一行为,显然李某与张某会把它归类到不同的素

5、质成分中给与不同的素某与张某会把它归类到不同的素质成分中给与不同的素质成分中并给与不同的评价。因此结构效度的检验分析质成分中并给与不同的评价。因此结构效度的检验分析也是一种定性的主观判断。在分析考评过程中,要采取也是一种定性的主观判断。在分析考评过程中,要采取有力措施把主观影响控制在最低点上。有力措施把主观影响控制在最低点上。二、结构效度二、结构效度p结构效度的分析可按一下几步进行:结构效度的分析可按一下几步进行:1.1.给所要测评的素质的结构模式下一个操作化的定义给所要测评的素质的结构模式下一个操作化的定义 “我们所要测评的素质是对我们所要测评的素质是对xxxx的态度、有关的态度、有关xxx

6、x的品质、有关的品质、有关xxxx的的技能。技能。”像这样一些表述所测评素质的具体形象是什么,结构是像这样一些表述所测评素质的具体形象是什么,结构是什么,我们并不清楚,它仍然是从具体行为概括出某种意识或观什么,我们并不清楚,它仍然是从具体行为概括出某种意识或观念,因此对结构效度的分析没有多大意义。这里的构建不是从行念,因此对结构效度的分析没有多大意义。这里的构建不是从行为向观念构建,而是相反,由观念向具体行为的构建。不是简单为向观念构建,而是相反,由观念向具体行为的构建。不是简单还原,而是在更高的水平上抓住所测素质的本质特征,确定一个还原,而是在更高的水平上抓住所测素质的本质特征,确定一个可感

7、觉可操作的结构模式,由这种具体的结构模式作为抽象观念可感觉可操作的结构模式,由这种具体的结构模式作为抽象观念建构的替代物。这种替代物的成分显然应该是我们世纪能够看到建构的替代物。这种替代物的成分显然应该是我们世纪能够看到的、听到的、感觉到的东西。例如:外显行为、客观性生理反应的、听到的、感觉到的东西。例如:外显行为、客观性生理反应等。素质测评的目标体系实际上就是所测素质的一个行为构建模等。素质测评的目标体系实际上就是所测素质的一个行为构建模型,这种结构模型分别由项目、指标、权重、标度等组成。这种型,这种结构模型分别由项目、指标、权重、标度等组成。这种模型的建构,在很大程度上取决于所测素质本身的

8、特征及其抽象模型的建构,在很大程度上取决于所测素质本身的特征及其抽象程度等组成。程度等组成。要定义或建构一个素质的结构模型,可以从以下几方面着手:要定义或建构一个素质的结构模型,可以从以下几方面着手:首先,采取工作分析方法,对所想测评的素质进行结构分析与行为首先,采取工作分析方法,对所想测评的素质进行结构分析与行为分析,确定各种素质结构及其代表的行为。分析,确定各种素质结构及其代表的行为。其次,用图表的形式逐一列出工作分析得到的素质因素及其特征行其次,用图表的形式逐一列出工作分析得到的素质因素及其特征行为。除此之外,还可以通过查找历史上或现在人们对所测评素质为。除此之外,还可以通过查找历史上或

9、现在人们对所测评素质的模型的现成资料,丰富已有分析的结果。的模型的现成资料,丰富已有分析的结果。再次,还要另外准备一份与已经建构的模型可能混淆的但关系密切再次,还要另外准备一份与已经建构的模型可能混淆的但关系密切的其他模型图表。要反问自己并向人说明为什么所测素质是你所的其他模型图表。要反问自己并向人说明为什么所测素质是你所定义的结构模型而不是其他别的结构模型。定义的结构模型而不是其他别的结构模型。2.2.收集事实资料,评判结构效度,具体方法有收集事实资料,评判结构效度,具体方法有:当心多选:当心多选排除法排除法 如果测评结果能明确的排除它所对应素质结构模型的其他解释,如果测评结果能明确的排除它

10、所对应素质结构模型的其他解释,那就表明所获得的测评结果具有较好的结构效度。那就表明所获得的测评结果具有较好的结构效度。咨询法咨询法 可以请一些有经验的专家就你所获得的测评结果、所对应的素质可以请一些有经验的专家就你所获得的测评结果、所对应的素质结构进行判断或推断,问他们该测评结果实际测评的素质是什么。结构进行判断或推断,问他们该测评结果实际测评的素质是什么。如果大家的回答与你所想测评的素质结构几乎一致,那么说明你如果大家的回答与你所想测评的素质结构几乎一致,那么说明你的测评有较好的结构效度。的测评有较好的结构效度。相关法相关法 找一个具有较高结构效度的测评工具或结果,与你所获得的测评找一个具有

11、较高结构效度的测评工具或结果,与你所获得的测评结果进行相关性分析,如果相关性很高,说明你的测评结果具有结果进行相关性分析,如果相关性很高,说明你的测评结果具有较高的结构效度。较高的结构效度。 逻辑分析法逻辑分析法 当大家对所测素质的结构模型具有比较一致的认识时,只要能判当大家对所测素质的结构模型具有比较一致的认识时,只要能判定测评内容(工具)选择正确,且整个测评过程除了一切外来干定测评内容(工具)选择正确,且整个测评过程除了一切外来干扰因素,就可以说测评结果具有较好的结构效度。扰因素,就可以说测评结果具有较好的结构效度。 例如:测评时间足以保证被测评者完成所有的工作,被测评者没例如:测评时间足

12、以保证被测评者完成所有的工作,被测评者没有受到催促因素的影响;测评工具的指导十分明确,被测操作准有受到催促因素的影响;测评工具的指导十分明确,被测操作准确。确。多元分析多元分析 多元分析就是采取聚类分析与主成分分析等数学手段,对测评结多元分析就是采取聚类分析与主成分分析等数学手段,对测评结果进行分析,看分析的结果。果进行分析,看分析的结果。p 例如:所找出的主要因素与分类结果,与所想测评素质的结构例如:所找出的主要因素与分类结果,与所想测评素质的结构是否一致,如果一致,则说明所获得的测评结果具有较好的结构是否一致,如果一致,则说明所获得的测评结果具有较好的结构效度。效度。 p主成分分析主成分分

13、析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。p群分析,是根据群分析,是根据“物以类聚物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的验知识的情况下进行的 三、关联效度三、关联效度p又称又称实证效度、效

14、标效度、效标关联效度实证效度、效标效度、效标关联效度,是指测评结果与效标(标,是指测评结果与效标(标准结果)的一致性程度。准结果)的一致性程度。效标是一种用来衡测评有效性的外在参照标效标是一种用来衡测评有效性的外在参照标准准, , 它可以是一种测评的结果它可以是一种测评的结果, , 也可以是标准测评分数。也可以是标准测评分数。根据效标是根据效标是否可以否可以同时获得同时获得, , 可将关联效度分为可将关联效度分为同时效度与预测效度。同时效度与预测效度。作为效标作为效标的结果与预测结果同时获得的结果与预测结果同时获得, , 这种效度称之为同时效度。当作为效标这种效度称之为同时效度。当作为效标的结

15、果是后来测评中获得的结果是后来测评中获得, , 这种效度称为预测效度,它反映了现在的这种效度称为预测效度,它反映了现在的测评结果对未来素质发展的预测程度。测评结果对未来素质发展的预测程度。 例如:两个人同时采用观察评定与问卷测验测评同一个人的工作态度,例如:两个人同时采用观察评定与问卷测验测评同一个人的工作态度,两个测评结果相关系数很高,例如两个测评结果相关系数很高,例如0.800.80,那么以后在类似的情况下,那么以后在类似的情况下,可以用问卷测验代替花时太多的行为观察法。可以用问卷测验代替花时太多的行为观察法。看公式看公式P259P259考过考过关联效度关联效度 关联效标的分析关键在于效标

16、的选择。效标作为衡量测评结果有效性的关联效标的分析关键在于效标的选择。效标作为衡量测评结果有效性的参照标准,应该是可以测评到且独立于所分析的测评结果的行为结果。参照标准,应该是可以测评到且独立于所分析的测评结果的行为结果。效标可以分为效标可以分为行为效标行为效标与与观念效标观念效标。 行为效标的行为效标的选择以客观性为依据。常见的行为效标有以下几种:选择以客观性为依据。常见的行为效标有以下几种:考过考过学术成就:学术成就:作品的数量作品的数量、质量质量、发行量(教材有误)发行量(教材有误)特殊训练成绩特殊训练成绩实际工作表现与成绩实际工作表现与成绩团体特征团体特征等级评定结果等级评定结果先前被

17、证明是有效的测评结果先前被证明是有效的测评结果第二节第二节 信度信度p信度的概念信度的概念 信度是指测评结果所反映所测素质的准确性。信度是指测评结果所反映所测素质的准确性。一个人的高度在同一天测量了两次,一次是162厘米,一次是159厘米. 一个学生,参加研究生入学考试春季考了300分,秋季考了390分.一个人参加两个不同形式的智力测验,一个测验获得智商是100,另一个测验上的智商是114.信度(Reliability):测验是否精确(Precision)效度(Validity) :测验是否正确(Accuracy)信度和效度的意义信度和效度的意义第二节第二节 信度信度p准确性的考量,目前大致有

18、准确性的考量,目前大致有稳定系数分析、等稳定系数分析、等值系数分析、分半系数分析、内部一致系数分值系数分析、分半系数分析、内部一致系数分析、评分一致性系数分析等析、评分一致性系数分析等。注意一下。注意一下 以上几种信度都是针对常模参照测验而言的,以上几种信度都是针对常模参照测验而言的,标准参照测验中的信度计算通常使用分类一致标准参照测验中的信度计算通常使用分类一致性信度,这种信度的的常用估计方法是考察同性信度,这种信度的的常用估计方法是考察同一批被测者在两次是册或者复本测验中的分类一批被测者在两次是册或者复本测验中的分类是否一致。标准参照测验中的信度也可以使用是否一致。标准参照测验中的信度也可

19、以使用K K系数计算,较分类一致性信度在统计上更合系数计算,较分类一致性信度在统计上更合理(理(Cohen,1968;Aiken,1988Cohen,1968;Aiken,1988)。)。一、再测信度一、再测信度p指以同样的测评工具指以同样的测评工具, , 按照同样的方法按照同样的方法, , 对于相同的对象再次进行测评对于相同的对象再次进行测评, , 所所得先后结果的一致性程度得先后结果的一致性程度。(。(教材有误教材有误)再测信度的计算一般采用)再测信度的计算一般采用皮尔逊积皮尔逊积差相关系数。(测评结果前后两次出现的稳定度(一致性)差相关系数。(测评结果前后两次出现的稳定度(一致性)p个体

20、的素质测评在测评过程中会涉及许多因素的影响,素质本身有时也无法个体的素质测评在测评过程中会涉及许多因素的影响,素质本身有时也无法精确定义。我们常常把对个体测评结果的准确性检验,置于群体测评结果的精确定义。我们常常把对个体测评结果的准确性检验,置于群体测评结果的相互关系中,转化为两次位置关系的一致性分析。当同一对象的测评结果以相互关系中,转化为两次位置关系的一致性分析。当同一对象的测评结果以同样的测评方式再次获得后,其顺序位置关系变异很小时,则说明测评结果同样的测评方式再次获得后,其顺序位置关系变异很小时,则说明测评结果比较准确。比较准确。p例如:在技能测评中李某的分数是,在全体被测者中排名第一

21、,这到底例如:在技能测评中李某的分数是,在全体被测者中排名第一,这到底准不准呢?我们再重复测评一次,结果李某的分数是,还是排名第一,准不准呢?我们再重复测评一次,结果李某的分数是,还是排名第一,而且其他被测的位置顺序变化很小,我们就可以说第一次的技能测评结果很而且其他被测的位置顺序变化很小,我们就可以说第一次的技能测评结果很可靠。可靠。p教材积差相关性分析。教材积差相关性分析。P263P263二、复本信度 复本信度测评结果相对另一个非常相同的测评结果的变异程度。复本信度测评结果相对另一个非常相同的测评结果的变异程度。p“非常相同非常相同”一般以等值解释。所谓等值一般以等值解释。所谓等值, ,

22、是指在测评内容、效度、要求、形是指在测评内容、效度、要求、形式上都与原测评一样式上都与原测评一样, , 其中一个测评可以看作是另一个测评的近似复写其中一个测评可以看作是另一个测评的近似复写, , 即复即复本。本。p“变异程度变异程度”一般以它的反义词一般以它的反义词“一致性一致性”解释。解释。p因此复本信度实际上是一种用等值系数揭示的信度。因此复本信度实际上是一种用等值系数揭示的信度。等值系数即为两组测评结等值系数即为两组测评结果的相关系数。果的相关系数。计算公式算公式见教材教材P264,考考过。 三、三、一致性信度一致性信度p一致性信度又称同质性信度,一致性信度又称同质性信度,是指相同测评项

23、目分数间的一是指相同测评项目分数间的一致性程度。致性程度。反映了测验题目与所测量内容的一致性程度。反映了测验题目与所测量内容的一致性程度。p如果被测在第一个项目上比其他人分数高,在第二个项目上如果被测在第一个项目上比其他人分数高,在第二个项目上又比其他人高,在第三个项目上也比其他人高又比其他人高,在第三个项目上也比其他人高相反另一个人在第一个项目上比其他人分数低,在第二个项相反另一个人在第一个项目上比其他人分数低,在第二个项目上又比其他人低,在第三个项目上也比其他人低目上又比其他人低,在第三个项目上也比其他人低那么毫无疑问,我们会认为测评结果比较可靠。那么毫无疑问,我们会认为测评结果比较可靠。

24、p信度的这种分析常见的两种方法:项目半折分析,另一种是信度的这种分析常见的两种方法:项目半折分析,另一种是系数分析。项目半折分析是把测评结果分成系数分析。项目半折分析是把测评结果分成2 2半,一半是半,一半是偶数号项目的得分的总和,一半是奇数号项目得分总和,计偶数号项目的得分的总和,一半是奇数号项目得分总和,计算他们相关性。求出相关性系数再带入公式求一致性系数。算他们相关性。求出相关性系数再带入公式求一致性系数。四、评分者信度四、评分者信度p评评分分者者信信度度指指多多个个测测评评者者给给同同一一组组被被测测样样组组进进行行评评分分的的一一致性程度。致性程度。p测测评评与与选选拔拔结结果果的的

25、差差异异程程度度来来自自两两方方面面一一是是被被测测评评者者自自身身, , 二二是是测测评评者者及及其其测测评评。信信度度主主要要是是对对后后者者为为依依据据, , 测测评评者者及及其其测测评评的的无无关关差差异异越越小小, , 测测评评与与选选拔拔结结果果就就越越可可靠靠。评评分分者者信信度度主主要要用用于于通通过过面面试试与与观观察察评评定定等等主主观观性性测测评评方方法法获得的结果的可靠性分析。获得的结果的可靠性分析。p测测评评者者的的评评分分是是引引起起主主观观性性测测评评结结果果差差异异的的主主要要原原因因。客客观观性性测测评评是是利利用用计计算算机机评评分分, , 不不受受主主观观

26、因因素素影影响响, , 不不存存在在评分误差。评分者信度主要采用肯德尔和谐系数计算。评分误差。评分者信度主要采用肯德尔和谐系数计算。p评分者信度与测评方法信度对测评结果的影响。评分者信度与测评方法信度对测评结果的影响。P266(考过)考过)p提高测评可靠性的方法。提高测评可靠性的方法。P267(考过)考过)项目分析项目分析项目质量的考评指标。 考过考过p适合度适合度 在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标)在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们无难易之分,它们无难易之分,适合度指的是被测者行为适合度指的是被测者行为( (回

27、答及实际表现)符合项目测评标回答及实际表现)符合项目测评标准的程度。准的程度。当项目为试题时,适合度即难度;当项目是问卷中的问题时,符合度当项目为试题时,适合度即难度;当项目是问卷中的问题时,符合度即所有选对的被测者人数与总人数之比(即所有选对的被测者人数与总人数之比(计算,考过计算,考过););当项目为观察评定量表当项目为观察评定量表中的指标时,符合程度即所有被测得分平均值与指标满分值之比中的指标时,符合程度即所有被测得分平均值与指标满分值之比。(。(适合度计算适合度计算考过考过)P268P268p区分度区分度 又称鉴别力,又称鉴别力,指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力

28、指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力,也即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。也即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。区分度区分度高的项目很容易把优秀者也一般者区分开来。高的项目很容易把优秀者也一般者区分开来。项目区分度的计算方法主要有相关项目区分度的计算方法主要有相关分析法(包括积差相关法、二列相关法和点二列相关法)、极端组法(鉴别度指分析法(包括积差相关法、二列相关法和点二列相关法)、极端组法(鉴别度指数、临界比)和因素分析法数、临界比)和因素分析法p独立性独立性 在能力在能力测评中,常常需要中,常常需要项目之目之间有一定

29、的独立性。有一定的独立性。所所谓独立性即非相关性或低独立性即非相关性或低相关性。相关性。独立性的分析一般采用独立性的分析一般采用项目目间分数的相关系数揭示,根据分数的相关系数揭示,根据实际得分分布得分分布是否均匀,可以分是否均匀,可以分别采用采用rr系数法和列系数法和列联表表检验法。法。 项目分析项目分析p选项率选项率p指被测者对是非正确答案的选择比例指被测者对是非正确答案的选择比例。它是反映项目它是反映项目选项质量的一个指标。选项质量的一个指标。诱答或正答拟定的好坏决定整个试题的质诱答或正答拟定的好坏决定整个试题的质量及分数可信性。量及分数可信性。对于诱答或正答质量的分析方法有两种:对于诱答

30、或正答质量的分析方法有两种:p诱惑力分析法诱惑力分析法 这种方法是采用表格形式,分别统计高分组与低分组中的被测者对同一这种方法是采用表格形式,分别统计高分组与低分组中的被测者对同一项目各选项的选择次数。项目各选项的选择次数。p“白智白智”试测法试测法 这种方法是找一些对测验内容一无所知或十分陌生的人作为被测者进行这种方法是找一些对测验内容一无所知或十分陌生的人作为被测者进行测试,通过分析这些人对每个诱答选择的人次来分析选项的质量。测试,通过分析这些人对每个诱答选择的人次来分析选项的质量。3种情种情形。见教材形。见教材P272其他指标的分析其他指标的分析p客观性客观性 测评的客观性由测评方法的客

31、观性与测评者的客观性两方面构成测评的客观性由测评方法的客观性与测评者的客观性两方面构成. .见教材见教材P274P274p误差误差 误差是指通过测评结果的定性定量分析,判断测评结果是否受到心理效应的严重误差是指通过测评结果的定性定量分析,判断测评结果是否受到心理效应的严重影响。分析的主要内容是心理误差、标准误差以及单个测评结果的致信区间。影响。分析的主要内容是心理误差、标准误差以及单个测评结果的致信区间。见教材见教材P274(P274(考过)考过)其他指标的分析其他指标的分析见教材见教材P274(P274(考过)考过)哈罗效应误差哈罗效应误差哈罗效应又称晕轮效应,哈罗效应又称晕轮效应,是指测评

32、者往往会因为对被测评者整体印象的好坏是指测评者往往会因为对被测评者整体印象的好坏从而影响他对每个素质的测评从而影响他对每个素质的测评。例如因看到一个人相貌端庄、严肃,就容易。例如因看到一个人相貌端庄、严肃,就容易产生此人责任感很强的看法。由哈罗效应引起的误差叫哈罗效应误差。产生此人责任感很强的看法。由哈罗效应引起的误差叫哈罗效应误差。哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,所所谓一好百好,一丑白丑。虽然这是一种泛化影响,而前者是一种演绎影响。谓一好百好,一丑白丑。虽然这是一种泛化影响,而前者是一种演绎影响。

33、趋中心理误差趋中心理误差趋中心理误差是指因趋中心理误差是指因为测评者既不愿把被测评得过好,也不愿把被测评的过差而为测评者既不愿把被测评得过好,也不愿把被测评的过差而过于集中在中间段而产生的误差。过于集中在中间段而产生的误差。这种误差使有差异的被测得到相同或相近的分这种误差使有差异的被测得到相同或相近的分数,缺乏区分性。可以通过测量结果的分布及差异量分析来揭示这种误差的情况。数,缺乏区分性。可以通过测量结果的分布及差异量分析来揭示这种误差的情况。宽大心理误差宽大心理误差宽大心理误差指因宽大心理误差指因测评者不坚持测评的标准要求就高不就低的测评而产生的误差测评者不坚持测评的标准要求就高不就低的测评

34、而产生的误差。这种误差表现为皆大欢喜,高分低能。另一种这种误差表现为皆大欢喜,高分低能。另一种负负向宽大心理误差,则是过于严格,向宽大心理误差,则是过于严格,以一些脱离实际的高标准去测评人的素质,测评结果普遍较低。以一些脱离实际的高标准去测评人的素质,测评结果普遍较低。逻辑误差逻辑误差逻辑误差指逻辑误差指测评者不是实事求是的对每个素质独立地测评,而是依据其测评者不是实事求是的对每个素质独立地测评,而是依据其是否相关的特点而进行逻辑上的推断。是否相关的特点而进行逻辑上的推断。对比效应误差对比效应误差对比效应误差指测评者在测评过程中因被测与标准间存在某种明显的反差对比效应误差指测评者在测评过程中因

35、被测与标准间存在某种明显的反差而产生的误差。而产生的误差。这种误差又叫托衬效应误差。这种误差又叫托衬效应误差。例如鹤立鸡群,绿叶丛中一点红。例如鹤立鸡群,绿叶丛中一点红。接近效应误差接近效应误差接近效应误差是指接近效应误差是指测评者往往会把在时间、内容、形状等特征相似或相近测评者往往会把在时间、内容、形状等特征相似或相近的两个对象,给以同样的评价,而不论他们实际上是否有差别。的两个对象,给以同样的评价,而不论他们实际上是否有差别。例如某个素质低的人夹杂在两个素质好的人之间,其测评分数就容易偏高,例如某个素质低的人夹杂在两个素质好的人之间,其测评分数就容易偏高,相反,一个素质高的人夹杂在两个素质好的人之间,他的分数就有可相反,一个素质高的人夹杂在两个素质好的人之间,他的分数就有可能偏低。能偏低。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号