07年4月北大版“心理测量”串讲资料(2)-自考题库

上传人:ja****ee 文档编号:183175157 上传时间:2021-05-31 格式:DOCX 页数:7 大小:21.06KB
返回 下载 相关 举报
07年4月北大版“心理测量”串讲资料(2)-自考题库_第1页
第1页 / 共7页
07年4月北大版“心理测量”串讲资料(2)-自考题库_第2页
第2页 / 共7页
07年4月北大版“心理测量”串讲资料(2)-自考题库_第3页
第3页 / 共7页
07年4月北大版“心理测量”串讲资料(2)-自考题库_第4页
第4页 / 共7页
07年4月北大版“心理测量”串讲资料(2)-自考题库_第5页
第5页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《07年4月北大版“心理测量”串讲资料(2)-自考题库》由会员分享,可在线阅读,更多相关《07年4月北大版“心理测量”串讲资料(2)-自考题库(7页珍藏版)》请在金锄头文库上搜索。

1、07年4月北大版“心理测量”串讲资料(2) 第一节 心理测验的对象、目的及目标 1. 在编制测验前首先要明确测量的对象:也就是该测验编成后要用于哪些团体。其包括三个重要的维度,即年龄、教育水平和文化背景。 2. 测验的目的:一般来说;显示和预测。由此我们可以分为两类测验:显示性测验和预测性测验。(1)显示性测验:是指测验题目和所要测量的心理特征相似的测验。有些观察法、行为评估法也都是显示性测验,题目取自一个很明确的总体的测验即是样本测验,题目取自一个全开发的总体的测验即是标记测验。(2)预测性测验:指预测一些没被测量的行为的测验。 心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理

2、变量或行为特征。(1)工作分析:对于选拔和预测功用的预测性测验,主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。(2)对特定概念下定义:如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。(3)确定测验的具体内容:如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能,从中取样。 第二节 测题的编写技术 1. 搜集有关资料:题目的有关来源 (1)已出版的标准测验; (2)理论和专家的经验(3)临床观察和记录 2. 命题的原则及编写要领:1、

3、命题的原则(理解):; 内容方面。首先,要求题目的内容符合测验的目的;其次,内容取样要有代表性;第三,题目间内容相互独立,互不牵连。 文字方面。使用语言要准确,语句要简明扼要,最好一句话说明一个概念,尽量少使用双重否定句。理解方面。题目应有确切的答案,题目的内容不要超出受测团体的知识水平和理解能力,题目格式要容易理解。 社会敏感性方面。应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。 菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略: 1命题时假定被试具有某种行为,、使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。2命题时假定规范不一致。3指出该行为是常

4、见的,虽然是违规的。2、测题的编制要求:对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:提供型选择型题目。提供型题目要求被试给出正确答案,如论文题、简答题、填充题等;选择型题目要求被试在有限的几个答案中选择正确的答案,如选择题、是否题、匹配题等。选择题我们比较熟悉,它由两部分分构成:提干和选择。题干就是呈现一个问题的情景,一般由直接问句或不完全的陈述问或不完全的陈述句构成。选项就是问题的多种可能答案,常常是包括一个正确答案,若干(一般是15个)错误答案,其中错误的答案叫“诱答”。 第三节 测验的编排和组织 一、测题的编排 1、测验编排的一般原则:测题的

5、难度排列易逐步上升。尽可能将同类型的测题组合在一起。各种类型测题本身的特点。 2.两种常见的试题排列方式:(1)并列直进式:整个测验按试题材料的性质归为若干分测验,在同一分测验的试题依其难度由容易到难排列。(2) 混合螺旋式:先将各类试题依难度分成若干不同层次,再将不同性质的试题加以组合,作交叉式排列,难度则渐次升进。 第三章 测验的信度 第一节 信度的概念 1.信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。 信度理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E)

6、,两个部份构成的,公式为: X=T+E 讨论一组测验分数的特性时,可用方差导标具体分数,公式: (测验实得分数的方差) (测验真分数的方差) (测验误差的方差) 操作定义:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式: 由于真实分数的方差是无法统计的,因此公式3-3可转化为: 在(书上)图3-1下面的话看一看。 2、信度的指标 (1)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式是: (2) 测量标准误:信度系数表示一组测量的实得分数与真分数的符合程度,但并没有直接支

7、出个人测量分数的变异量。 测量的标准误与信度之间呈反比关系:标准误越小,信度越;标准误越大,信度越低。 3、信度与测验分数的解释:(1)解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。(2)比较信度可以接受的水平:一个测验究竟信度多高才适合,才让人满意呢?当然,最理想的情况是 =1.00,但实际上办不到。一般原则是:当 0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70 0.85时,可用于团体比较;当 0.85时,才能用来鉴别或预测个人成绩或作为。(3)解释个人分数的意义:从

8、信度可以解释个人分数的意义,这是测量标准误的应用。它有两个作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。看书公式3-8.(4)比较不同测验分数的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。 第二节 信度的类型及估计方法 1、 重测信度:又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。 最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。 重测信度的前提假设是:

9、所测量的特性必须是稳定的;每个人对前一次反应的遗忘程度相同;在时间间隔中没有学习另外的与测验有关的东西。 2、 复本信度:又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。 复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。 同重测信度一样,复本信度也要考虑两个复本实施时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的

10、一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。 内部一致性信度包括:分半信度和同质性信度。(1)分半信度:指采用分办法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。1常见的是将测题按其序列号的奇偶分半,这种分法的前提是:测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。2常用的修正公式是:

11、斯皮尔曼布朗公式: 3、 斯皮尔曼布朗公式为经验公式,他的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用:弗朗那根公式或卢伦公式中的任一一个。(公式见书3-12、3-13) 同质性信度:指测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。此外,对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。同

12、质性信度的公式主要有:库德-理查逊公式:常用的是K-R20公式,在个各测题难度相同或近似的情况 下,还可采用计算更为简便的K-R21公式。 克伦巴赫系数(这几个公式在书上好好看看) 4、 评分者信度:用于测量不同评分者之间所产生的误差。为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 第三节 影响信度的因素 1、 样本的特征:(1)样本团体分数分布的影响:任何相关关系都是受到团体中分数分布的影响,当分布范围增大时,其信度

13、估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。(2)样本团体异质性的影响:若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。 2、 测验的长度:在一个测验中增加同质的题目,可以使信度提高。测验越长,测验的测题取样或内容取样越有代表性;测验越长,被试的猜测因素影响越小。 3、 测验的难度:如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。两种情况均会使信度样本的分数范围变窄,从而使测验变得

14、不够可靠。 4、 测验的时间间隔:以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越大,信度系数便越低。 第四章 测验的效度 第一节 效度的概念 1、 效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。效度是科学测量工具最重要的必备条件。(1)一组测验分数的总方差等于真实方差与误差方差之和,而真实方差又可分为两部分,即有关的方差和无关的但稳定的方差,后者也就是所谓系统误差带来的方差 (公式4-2)。 2、 信度和效度的关系(1)信度是效度的必要而非充分条件:从方差分配公式: 可以看出, 增

15、大,即效度高,信度的真方差( )必然大,故信度必然高。当信度高时,即 降低时, 是否增加还要看 是否增减,因此效度不一定就高。效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必然条件,并不是效度高的充分条件。(2)效度是受信度制约的 3、 效度的性质:(1)a效度具有相对性:在评鉴测验的效度时,必须考虑其目的与功能。只有所测的结果符合该测验的目,才能认为它是个有效的测量工具。(2)效度具有连续性。测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。 第二节 效度的类型与估计方法 一、效度的类型及评估方法 1、内容效度:指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。(名词解释) (1)想编制有较高内容效度的心理测验:1要对所测量的心理特性有个明确的概念,并划定出哪些行为与这心理特性有关,又比较密切。2测验题目应是所界定的内容范围的代表性取样。 (2)需要说明的是,要求内容效度的测验,并不一定要求测验

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号