文档详情

(完整版)心理测量考试复习

pu****.1
实名认证
店铺
DOCX
46.97KB
约12页
文档ID:517880135
(完整版)心理测量考试复习_第1页
1/12

一、最早的智力测验-—比奈-西蒙量表P111比奈(Alfred Binet) 法国心理学家,心理测验的鼻祖贡献:(1) 提出了测量智力的方法,并建立了最早的相对客观、量化的度量工具2) 将智力测验成功地运用于教育领域,使人们看到了心理测验的应用价值,推动了心理测验的迅速发展. 智龄是比奈-西蒙智力量表中使用的判断智力的术语比奈智力量表系列主要有比奈量表、斯坦福一比奈量表和中国比奈量表一) 比奈量表比奈量表是比奈和西蒙编制的,有1905年、1908年和1911年三种版本内容:1905年版共有30道题,题目顺序由易到难排列,通过对3岁至11岁各50名正常儿童和部分智 力落后儿童以及成人测试的结果,分析确定题目的难易程度,并用不同难度的题目代表不同年龄的智力水平特点:①个体测验;②用智力年龄来评判结果不足:(1)从内容上看,该量表主要是对判断、理解和推理能力的测查,并不能涵盖智力的全部内容2) 从形式上看,这个量表无论是测验主持人的指导,还是被测者的回答或反应,主要都是以语言形 式进行的,因而对语言能力的依赖程度较大,这对某些特殊儿童如聋哑儿童是不公平的3) 这个量表不能准确地表示测验总分,只能以被测者完成题目的多少来大致确定其智力水平.行为样本(behavioral sample)就是“少数有代表性的行为” P31标准化(standardization) P32是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序, 保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。

① 测验题目的标准化;②实施过程和记分的标准化;③选用有代表性的常模信度(reliability),主要是指测量结果的可靠性或一致性P32信度(reliability)是指测验结果的可靠 性、稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征简言之,信度就是对测量一致性程度的估计. #误差的含义和类型P1401. 含义:误差 测量中与目的无关的变因所产生的不准确、不一致的效应.2 类型(1) 抽样误差——由样本变动而产生的误差 信度或效度估计中,抽样误差可以忽略不计2) 系统误差——与测 验无关的因子所引起的恒定、系统的、有规律的变化,存在于每次测验中,又称常定误差.系统误差影响效度,但与信度无关.(3) 测量误差(或观察误差、随机误差、偶然误差)——使用测量工具进行心理测量所造成的误差 测量误差是不系统的、随机的,偶然因素引起的信度完全受测量误差的影响,也会影响效度.#影响信度系数的因素P156 一、分数分布范围的影响(一) 团体的异质性如同所有相关系数一样,信度系数受分数的分布范围所影响,而分数范围与被试团体的异质程度有关 一个团体越是异质,其分数范围越大;而一个经过筛选,相对同质的团体分数较为均匀。

提高信度系数,需要测验团体的异质性高团体异质性不同,分数的标准差亦不同当将测验用于标准差不同的团体时,可用克莱公式推算出新的信度 系数如=1-仝叫严)(5.22)(5,21)式中几为信度系数已知的分布的标准差,为信度系数未知的 分布的标准差,瑞『为用于康团体的價度,如为用于异质程度不 同的团休时的信度二)团体的平均水平对于不同水平的团体,题目具有不同的难度每个题目在难度上的微小差异累积起来便会影响信度 这种影响都不能由统计公式来推估,只能从经验中发现它们比如:斯坦福一比奈测验的信度系数从083到0.98不等年龄较大的比年龄较小的信度高,智商较低的 比智商较高的信度高二、测验长度的影响 一般说来,在一个测验中增加同质性的题目,可以使信度提高增长度的散果可型卑斯皮尔曼“爭談金武的現貳考甘式中K为改变后的长度与原来长度之比,%为祿测验的慣度, 为囲验长度悬原来的K倍可的傅财计假设有一个包括10个题目的测验,信度为050,若把测验增加到50个题目,其信度将增加到:叢5—弓翹目數量对和吳系数的彫响■题目数量1ft /「50100200300 .•柏关碱0.500,83 冲9.91-■Ot35■—.-― '— 10,»80 !当由于测题过少而导致信度较低时:增加多少个题目可以达到理论的信度指标,可以用下式来推算:(5.23)解出K值.便可以确定一个测验究竟要增长多少才能达到理 想的信度水准“例如* 一个包含別个题目的测验信度为0J5,欲将倩度提髙到O.SO,需要増加多少題目? ^用._{£0冥,」_一匕7斤)斗0 J5 X < 1 OtSO)即要取得0.9)的諮 测验任度应为原来的』格,即需再増加100个锁FL三、 测验难度的影响当测验过难且题目形式为选择题时,受试者会对许多题目作随机反应——瞎猜,这样我们就无法对其分数置 信。

若大部分人随机作答,分数的差别将主要取决于随机误差,因而信度将趋近于零.因此,如果题目确实允 许猜测,应使整个测验稍容易一点,以减少猜测机会,增加可靠性.洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五选题 070四选题 074三选题 077是非题085四、 间隔时间以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性 越大,受外界的影响也越多,信度系数就越低效度(validity),与测量目标有关的真实分数方差(即由测量目标变量所产生的方差)与总分方差的比率 P33效度是一个测验对其所要测量的特性测量到什么程度的估计通俗的说,也就是测验是否精确的测量了想要测的东西社会赞许性做答,有的受测者可能会掩饰自己真实情况,按照社会认可的方式去做出自我评价,使自己看起来 更“好”效度指标主要包括:① 效标关联效度② 内容效度③ 构想效度rXY二Sv2/SX2,Sv其中是有效方差,SX是总方差P170而 SX2二ST2+SE2二SV2+SI2+SE2可见,造成测验分数变化的原因出自三大来源:测量对象本身的变化,量具的精度造成的系统误差,量具使 用中造成的随机误差.二、效度评定的方法(一)内容效度1. 定义:检查测验内容是否是所要测量的行为领域的代表性取样的指标。

内容效度分析时要注意两方面的问题:1) 应避免将测验取样的行为领域过于泛化2) 要注意测验分数中无关因素的影响2. 内容效度的评估方法(1)没有可用的数量化指标,只能靠推理和判断评估2) 依赖条件:•测验内容范围明确;•测验内容的取样有代表性3) 确定方法:通常是由专家根据测验题目和假设的内容范围作系统的比较判断 也可间接借用其他统计指标说明,如评分者信度,复本信度等克朗巴赫法:由两个独立取自同样内容范围的测验的得分之相关来作数量的估计.3. 确定内容效度的步骤1) 确定总体范围,即描述有关的知识与技能及所用材料的来源;2) 编制双向细目表,确定内容和技能各自所占的比例,并由测验编制者确定各题所测的是何种内容与技能;3) 制定评定量表来测量测验的整个效度及其他特点4. 内容效度的应用(1) 最适合于评估教育和职业成就测验内容效度的评价可以回答以下两个问题:① 样本的代表性;② 无关因素的影响程度2) 评价某些用于选拔和分类的人事测验3) 不适用于能力倾向测验和人格测验5. 表面效度(face validity)表面效度是指测验在采用者或被试的主观认识上觉得有效的程度.有时为了取得被试的合作和信任,表面效度是不容忽视的。

适用领域:职业兴趣测验、成就测验等不适合领域:人格测验(二)效标关联效度(效标效度)1. 定义:反映测验分数与外在标准(效标)的相关程度,即测验分数对个体的效标行为表现进行预测的有效性 程度效标关联效度往往用于预测性测验这种测验中,根据测验分数作出的预测一般用于甄选决策.2. 效标关联效度的类型(1) 预测效度① 定义:反映由测验分数对任一段时间间隔后被试行为表现的预测程度② 适用范围:对人员进行选拔、分类和安置的人事测验2) 同时效度① 含义:效标材料和测验分数同时搜集② 应用范围:因为同时效度的评估不需要长期追踪,所以应用比较普遍3) 同时效度和预测效度的差异——测验目的不同前者多用于诊断现在的状态,后者多预测未来的结果3. 效标和效标测量(1)效标:衡量测验有效性的参照标准⑵效标测量:可操作的测量指标3)效标分类:观念效标:效标的实质概念内容效标测量:即效标的具体度量方法3)保证效标测量客观性的要点:① 避免偏见的影响(特别是等级评定)② 防止效标污染效标污染 由于评定者知道测验分数而影响个人的效标成绩的情形三)构想效度1定义:测验的构想效度是指测验能够测量到理论上的构想或特质的程度。

也称为结构效度.所谓构想通常指一些抽象的、假设性的概念或特质,如智力、创造力、言语流畅性、焦虑等这些构想往往 无法直接观察,但是每个构想都有其心理上的理论基础和客观现实性,都可以通过各种可观察的材料加以确 定构想效度关注的问题是:测验是否能正确反映理论构想的特性.2 确定构想效度的步骤(1) 建立理论框架,以解释被试在测验上的表现;(2) 依据理论框架,推演出各种有关测验成绩的假设;(3) 以逻辑和实证的方法来验证假设,根据这些累积材料决定这种理论 是否能恰当地解释现有材料,如果不 能作出恰当解释,则应该修正上述假设,直到能作出恰当的解释为止 收集有关结构效度资料的方法P177(1)测验内方法这类方法主要是通过研究测验内部构造(如测验的内容、对测题反应的过程,以及项目间或分测验间的 关系)来界定所测量的结构范围举例:口独生子女“合群性”的结构描述:口 1.见老师、小朋友主动匆“招呼与否;口 2.是愿意自己独自玩,还是与其他孩子一起玩?口 3.言语较多还是较少,见生人时害羞?大方否?□ 4.在做游戏时,与人交往时,能与人合得来吗?(2) 测验间的方法测验间的方法是同时考虑几个测验间的相互关联,从而获知这些测验所共有的特点是什么或这些测验是否测 量相同的结构。

测验间方法有多种: 因素分析;相容效度;会聚效度和区分效度① 相容效度相容效度是求一个新编好的测验(即一个需要确定其结构的测验)与另一个已知其结构的测验分数之间的相 关例如,新的智力溯验的分数通常与已作过效度确定的个别测验如斯坦福一比纳智力测验来比较,假如相关高, 则两测验所测且的是相同的结构,而且新测验的得分也可像已确定结构的测验的分数一样解释② 会聚效度和区分效度坎贝尔(D. T. Campbell)和费斯克(D. W. Fiske)1959年提出的构想效度的一种考验方法 会聚效度:一个测验与测量相同特质或构想等理论上有关的变量有高的相关区分效度:一个测验与测量不同特质或构想等理论上不同的变量有低的相关.P184重叠量的计算四、影响效度的因素P185(一) 测验的因素1. 测题中所用词汇和句型不能过于困难2. 试题的意思应该清楚3. 所编制的测题应该适合所要测量的学习结果.4. 测题中不能提供额外线索5. 测题的编制要合理6. 选择题的正确答案不能有明显的组型7. 测题数目 增加测题的数目8。

下载提示
相似文档
正为您匹配相似的精品文档