评估心理测评量表的标准

上传人:枫** 文档编号:487094217 上传时间:2023-05-15 格式:DOC 页数:10 大小:104KB
返回 下载 相关 举报
评估心理测评量表的标准_第1页
第1页 / 共10页
评估心理测评量表的标准_第2页
第2页 / 共10页
评估心理测评量表的标准_第3页
第3页 / 共10页
评估心理测评量表的标准_第4页
第4页 / 共10页
评估心理测评量表的标准_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《评估心理测评量表的标准》由会员分享,可在线阅读,更多相关《评估心理测评量表的标准(10页珍藏版)》请在金锄头文库上搜索。

1、Running head:CRiTERiA for ev aluation of psychological testing scale评估心理测评量表的标准Running head:CRiTERiA for ev aluation of psychological testing scale#Running head:CRiTERiA for ev aluation of psychological testing scale#评估心理测评量表的标准摘要量表是心理测评用来度量人的心理特征的测量工具,评价量表好坏的标准应该受到人们的重视,其重要性自然不言而喻。在系统地介绍评价心理测验量表的标准

2、的基础上,详细介绍了信度和效度的分析方法,包括重测信度法、复本信度法、分半信度法、a信度系数法、 内容效度分析、校标效度分析和结构效度分析。 根据量表用于判别、预测或评定等不同用途, 需要选取不同的检验方法。一个好的量表应该具有客观性、定量性、可交流性和经济性的特点。关键词 量表;信度;效度;评价标准1刖言测量是人们日常生产和生活中的一种普遍现象。从与人们平时生活紧密相连的衣、食、住、行四个方面来讲,穿什么尺寸的衣服和裤子需要对人的身体进行身高臂长和三围的测量;到市场买菜需要对蔬菜或者肉类进行称重的测量;盖楼建房或者装修需要对土地或者房间进行面积的测量;修建铁路或者搭建桥梁需要对地面进行长度和

3、高度的测量。以上提到的测量均属于物理测量,人们能够实实在在地测出需要的数据或者指标。除物理测量以外,根据测量的对象和性质还有生理测量,即对有机体生理特征的测量;社会测量,即对社会现象的测量;心理测量,即对人类的心理特征的测量。心理测量又叫心理测评, 现今被人们普遍认同的含义是指依据一定的心理学理论,使用一定的操作程序,给人的能力、人格以及心理健康等心理特征和行为确定出一种数量化的价 值。现阶段的心理测评是以心理测评量表为主要测评手段。心理测评是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。量表指的是能够使事物特征数量化的数字的连续体。制定量表的单位和参照点不同,编制出的量表

4、就不同;不同的量表具有不同的测量水平,因此其测量的精度也不尽相同。目前用于心理测量的各种心理测验和心理量表有二三百个,但是临床上和心理咨询工作中常用的只有一二十多种。这些常用量表中许多不对非专业人员公开,通常需要花费几百甚至上千元购买。针对非专业人员研究和学习心理学,对国内外常用的100多种心理测验量表和测量工 具进行优化选择,并将其中在心理咨询工作中经常用到的一些测验和量表编制成计算机软件或测量表,这就是人们说的常用心理测评量表。通俗来讲,就好像物理测量是用测量工具丈量客观事物具体的看得见的属性;而心理测评就是用尺子测量人类看不见的各种属性,而这把尺子就是量表。自从上世纪九十年代中期以来,我

5、国的心理学工作者自行编制和修订了许多心理测评量表,为临床工作者、企业、教育工作者和研究人员等提供了有效又实用的心理测量和行为测 量的测量工具,为人们治病救人、选拔人才、培育后代、探索知识做出了极大的贡献。可是 这些量表到底有没有效,到底适不适合相对应的群体就有待商榷了。大家都知道,如果用尺子丈量桌子的高度,读出尺子的刻度就能知道桌子的高度,并且进行多次测量之后取读数的平均值就可以知道桌子的准确高度。那么对于心理测评的尺子而言,我们如何选择尺子并判断它测得准不准呢?要回答这个问题,先要回答另外的问题,即这把尺子要用来测量什么?心理测评的施测者首先要明确的问题是,他想用量表来测量什么心理特征,而这

6、种心理特征有什么外显行为特征,也就是说可以从什么方面对这种心理特征进行客观评估,这些方面构成了量表的测量维度。美国的认知心理测量学家Embretson认为:首先要确定测验的结构,提出测验的认知模型,这种认知模型的详细特征为量表中的每一项条目进行了具体的说明。例如,儿童社交自我知觉量表( The Self-Perceived Social Compete nee Scale for Childre n )是Harter( 1982)根据儿童的知觉能力是通过不同领域的感觉评估的,而不是通过单一的认知 结构来评估的这个理论进行编制的,量表包含的四个维度分别是:社交自我知觉、认知自我知觉、运动技能自我

7、知觉和一般自我知觉。其次要确定量表的适用人群。总不能把测量精神病人的精神疾病量表给在校大学生做吧,也不可以把测量儿童智力的智力量表给成年人进行测验,这都是不合理的。另外,分析量表中的条目内容一致性也是有必要的,这就要提到内 容效度的分析,这点将在下文详细探讨。回到最初提出的问题,我们应该怎样判断一把尺子测量得准不准确?针对这个问题,首先,施测者要懂得正确使用这把尺子的方法,例如,要测量一个人的身高, 应该从头量到脚,而不能从头量到膝盖;尺子不能拿歪了,否则会产生误差;测量另一个人的身高时,如果前一个人脱了鞋,那这个人就不能穿着鞋测量;如果施测者前一分钟是睁着右眼读数的,那后一分钟就不能睁左眼读

8、数,当然睁着一只眼睛读数也是不允许的,这就是所谓的测验标准化。还有如果测得了一个人的身高,想知道他算高个子还是矮个子,就要把数据放在一群有代表 性的数据中进行比较,而且每个人都要与此群体进行比较,这就是所谓的常模。当然,难度与应答率也会影响心理测评量表的测量。信度与效度的测量在评估心理测评量表中也是十分 重要的。Running head:CRiTERiA for ev aluation of psychological testing scale#Running head:CRiTERiA for ev aluation of psychological testing scale2方法2.1

9、标准化心理测量这把尺子需要通过规范的方式来使用,而这规范的方式就是标准化。测验的标准化普遍被人所接受的定义就是指测验的编制、实施、计分以及测量分数的解释的程序的一致性。测验标准化需要具备的条件是(1)测验内容的标准化:指向所有接受测量的个人实施相同的或等值的测验内容,这是标准化的首要前提;(2)施测条件的标准化:指所有接受测量的个人必须在相同的施测条件下接受测验,包括相同的测验情景、 相同的指导语和相同的受测时限;(3)评分规则的标准化: 指所制定的评分规则要足以使不同的评分人的评分结 果保持最大程度的一致,这要求评分结果具有客观性;(4)测验常模的标准化。2.1.1常模常模是一组有代表性的群

10、体的平均测验分数。它表示的是普通人的一般状况。常模不同于标准,标准指的是理想上达到的程度,而常模指的是代表性群体实际达到的程度。以常模为参照进行的测验叫常模参照测验,以标准为参照进行的测验叫目标测验或者标准参照测 验。简单来说,常模是具有代表性的群体参与测验得到的测验分数的分布,平均数和标准差是两个极为重要的指标。利用一个人的原始测验分数,参照常模中的分数分布,就能知道个 体在总体中大概处于什么水平。因此,常模参照通常用来进行选拔性测验;而为了弥补常模参照的不足,只能知道个体在总体中的水平,却不清楚个体对测验领域的掌握情况,就有必要进行目标参照测验。 在同一个测验中,施测者应当选用相同的常模来

11、进行比较,这样有利于测验的准确性。2.2难度心理测评量表中,条目的难度是通过计算被试答对某一条目的人数比例来确定的。这是在编制教育成就测验和其他形式的能力测验时一个很重要的指标。如果一个测评量表的难度太高或太低,导致受试者难以完成测验或非常轻易地完成测验,都不能达到施测者想要测量的结果,那这样的量表是不合格的量表。2.3应答率应答率是通过客观地统计被试对某一条目的回答数来确定的。它针对的是例如态度测验、兴趣测验、性格测验等不存在难度问题的测验。2.4信度分析信度,指的是测量方法的质量,即对同一现象进行重复观察之后是否可以得到相同资料的一种反映。简单来说, 信度就是衡量心理测评量表的可靠性。例如

12、,如果我们用一个电子称测量一个人的体重,第一次测得他重100公斤,第二次测得 200公斤,第三次测得 150公斤,那么用这个电子称测量体重是极其不合适的,这就被称作是一个不好的测量工具。一个标准的电子称应该是同一个人在相隔较短的时间内,站上电子称,得到的体重读数是基本一致的。物理测量相比于心理测量较容易,毕竟人的心理特征是看不见摸不着的。而且我们也不能用同一套测验, 例如同一套物理试题或者同一个孤独感量表去反复测量同一个人,这样受试者会产生练习效应,使得测验结果越来越好。因此,我们需要更有效的办法进行测量。 信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式

13、的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有重测信度法, 复本信度法,分半信度法,a信度系数法。戴晓阳(2009)推荐0.8作为评价一个量表全量表内部一致性的标准,0.750.8作为评价量表的分量表内部一致性的标准。2.4.1重测信度法重测信度法是用同样的量表对同一组受试者间隔一定的时间重复施测,计算两次施测结果的皮尔逊积差相关系数。很明显,重测信度属于稳定系数。重测信度法适用于事实式量表, 如性别,出生年月等在两次施测中不应该有任何差异,大多数受测者的兴趣、爱好、习惯等 在短时间内也不会有明显的变化。如果没有突发性事件影响受测者的态度,意见,那么该方法也适用于对态度,

14、意见的测量。由于重测信度法需要对同一组受试者测验两次,期间受试者又不能受到突发性事件或他人的影响,而且间隔时间长短也有限制,因此在实际操作中略有难度。2.4.2复本信度法复本信度法是让同一组被试在两个平行测验上进行测试,计算两次测验结果的皮尔逊积差相关系数。复本信度属于等值系数。所谓平行测验是指两次测验的题目不同,但是测验的内容、格式、难度、等要完全一致。更苛刻的是,两次测验结果的平均值和标准差也要完全 相同。事实上在实际操作中,很难达到这种要求,因此用这种方法测量的人不多。2.4.3分半信度法分半信度法是将测验条目分为两半,计算两半得分结果的相关系数。分半信度属于内在一致性系数。这种方法适用

15、于态度、意见测验的信度分析,不适合测量年龄与性别等事实性 的特征,因为年龄与性别没法比较。再有,将测验条目分为两半的方法并没有规定,所以不同的分半方法会产生不同的分半信度值,这点需要注意。244 a信度系数法Cron bach a系数是目前最常用的信度系数,其公式为:rxx2_PiAiS;其中,K是题目数,Pi为答对第题的人数的比例,qi为答错第题的人数的比例,Sx2为测验总分的变异。由公式可以看出,a信度属于内在一致性系数。该方法仅适用于(0, 1)记分的测验。2.5效度分析效度,指的是测量工具或手段能够准确测出所需测量的事物的程度。简单来说,效度就是衡量测验或者量表的有效性,多大程度上达到了施测者想要通过测验获得的心理特征指 标。例如,如果用一个测量体重很有效的电子称去测量人的身高,那肯定是无效的;如果用测量孤独感很有效的量表去测量个体的睡眠质量,那也一定是无效的。 判断心理测评量表有没有效,关键是看它有没有达到测量目的。Anastasi指出:效度从一开始就融入了测验,而不是在测验编制实施的最后几个阶

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号