心理测量第5节测量效度ppt课件.ppt

上传人:资****亨 文档编号:125388764 上传时间:2020-03-17 格式:PPT 页数:61 大小:762.50KB
返回 下载 相关 举报
心理测量第5节测量效度ppt课件.ppt_第1页
第1页 / 共61页
心理测量第5节测量效度ppt课件.ppt_第2页
第2页 / 共61页
心理测量第5节测量效度ppt课件.ppt_第3页
第3页 / 共61页
心理测量第5节测量效度ppt课件.ppt_第4页
第4页 / 共61页
心理测量第5节测量效度ppt课件.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《心理测量第5节测量效度ppt课件.ppt》由会员分享,可在线阅读,更多相关《心理测量第5节测量效度ppt课件.ppt(61页珍藏版)》请在金锄头文库上搜索。

1、测量的效度 1 效度的含义 n效度指的是测量的有效性 即一个测验 对它所要测量的特质准确测量的程度 n在测量学中 效度被定义为与测量目的 有关的变异 有效变异 与实测变异之 比 2 效度的分类 n内容效度 n构想效度 n效标效度 3 内容效度 n内容效度是指项目对预测的内容或行为范围取 样的适当程度 n一个测验要具备较好的内容效度必须满足两个 条件 q要确定好内容范围 并使测验的全部项目均在此范 围内 q测验项目应是已界定的内容范围的代表性样本 4 确定内容效度的方法 n专家判断法 n复本法 n再测法 n经验法 5 n专家判断法 确定测验内容效度常用的方法是由专 家对测验项目与所涉及的内容范围

2、进行 符合性判断 这是一种定性分析的方法 6 具体的方法步骤如下 定义好内容总体 并描绘出有关知识与技能的轮廓 划分细纲目 并根据重要性规划好各个纲目的加权 比例 作出尽可能详细的描述 确定每道题所测的知识与技能 将自己的分类与测 验编制者的纲目作比较 制定评定量表 从各方面对测验作出评定 7 n复本法 克伦巴赫认为 内容效度可由一组被试在 取自同样内容范围的两个测验复本上得分的相 关来做数量上的估计 如果相关低则说明两个 测验中至少有一个缺乏内容效度 但无法确定 究竟哪一个缺乏内容效度 当相关高时 一般 推论测验具有内容效度 但也可能出现两个测 验有相同偏差的情况 8 n再测法 先将测验实施

3、于被试 由于被试对测 验内容了解甚少 因而得分较低 然后 对他们进行教学训练 结束时再测一次 如果成绩提高很大 说明测验对于教 学具有较高的内容效度 9 n经验法 不同的被试团体在测验上的得分和对 每题的反应存在较大差异 一般来说 高年级比低年级的水平要高 如果总分 和题目的通过率随着年级而增高 则说 明测验对于教学具有内容效度 10 内容效度的应用 n作为一种方法 内容效度较为适合于评价教育 成就测验和职业选拔测验 在这种测验中 测 验内容是知识 技能和实际工作的代表性样本 内容效度不仅是评价教育成就测验和职业选 拔测验的较好方法 而且也是编制任何测验都 应加以考虑的基本方面 内容效度对标准

4、参照 测验更为重要 因为在标准参照测验中我们主 要关心的是被试对一定范围内的知识 技能掌 握得如何 11 n内容效度与表面效度 表面效度是指测验题目从表面上看来有效 的程度 一般是由没有受过专门训练的外行人 对测验题目从表面上作出的评定 而内容效度则是由内行人 专家将测验题 目与内容范围作全面的考察 或者经过实地测 量与统计分析后对题目作出的评定 两者是有 区别的 表面效度是从表面上看问题 而内容 效度是从实质上看问题 12 例 有人在编制 领导能力测验 时编写了三 个问题 n我愿指挥别人 不愿别人指挥我 n我喜欢听古典音乐 n人们经常征求我的意见 13 通过预测发现 领导干部对第一 二 题做

5、肯定回答的人数比例明显高于一般 群众 对第三题做肯定回答的人数比例 与一般群众差不多 从区分能力看 第 三题应被淘汰 但是 若从表面上看 第一 三题都有表面效度 但第二题没 有表面效度 14 这说明 对于一个具体的测量目标来说 有表面效度的题目不见得真正有效 没有表面 效度的题目也可能有效 因此 表面效度不是 确定内容效度的客观指标 尽管如此 表面效 度对被试的动机 态度和行为会产生影响 从 而影响到测验的效度 因此在编制测验题目时 对表面效度要适当控制 15 一般来说 智力测验和学科测验要有较高 的表面效度 使被试产生较强的动机 尽最大 的努力去完成 如果这类测验表面效度不高 就很难获得被试

6、的信任与合作 被试就会马虎 从事 测不出真正的成绩 从而影响测验的效 度 相反 人格测验要求有较低的表面效度 使被试不会作假 按自己的典型方式作出反应 从而测到被试真正的人格特征 16 编制任何测验都必须考虑到内容效度 这样可以从测验内容上排除无关变量 对测量结果的影响 17 SCL90题目的表面效度 n1头痛 躯体化 n2神经过敏 心中不踏实 焦虑 n3头脑中有不必要的想法或字句盘旋 强迫症状 n4头晕或晕倒 躯体化 n5对异性的兴趣减退 抑郁 n6对旁人责备求全 人际关系敏感 n7感到别人能控制您的思想 精神病性 n8责怪别人制造麻烦 偏执 n9忘性大 强迫症状 n10 担心自己的衣饰整齐

7、及仪态的端正 强迫症状 18 n11 容易烦恼和激动 敌对 n12 胸痛 躯体化 n13 害怕空旷的场所或街道 恐怖 n14 感到自己的精力下降 活动减慢 抑郁 n15 想结束自己的生命 抑郁 n16 听到旁人听不到的声音 精神病性 n17 发抖 焦虑 n18 感到大多数人都不可信任 偏执 n19 胃口不好 饮食情况 n20 容易哭泣 抑郁 19 n21 同异性相处时感到害羞不自在 n22 感到受骗 中了圈套或有人想抓住您 n23 无缘无故地突然感到害怕 n24 自己不能控制地大发脾气 n25 怕单独出门 n26 经常责怪自己 n27 腰痛 n28 感到难以完成任务 n29 感到孤独 n30

8、感到苦闷 20 n31 过分担忧 n32 对事物不感兴趣 n33 感到害怕 n34 您的感情容易受到伤害 n35 旁人能知道您的私下想法 n36 感到别人不理解您 不同情您 n37 感到人们对您不友好 不喜欢您 n38 做事必须做得很慢以保证做得正确 n39 心跳得很厉害 n40 恶心或胃部不舒服 21 n41 感到比不上他人 n42 肌肉酸痛 n43 感到有人在监视您 谈论您 n44 难以入睡 n45 做事必须反复检查 n46 难以做出决定 n47 怕乘电车 公共汽车 地铁或火车 n48 呼吸有困难 n49 一阵阵发冷或发热 n50 因为感到害怕而避开某些东西 场合或活动 22 构想效度 所

9、谓构想效度就是指测验对理论上的 构想或特质的测量程度 构想效度也称 之为结构效度或建构效度 23 n构想是指心理学理论所涉及的假设性的抽象的 概念或特质 如动机 焦虑 智力 创造力等 它们都是表现在人的行为活动上的 往往用 某种操作来定义并且用测验来测量 因此构想 效度也可以理解为测验实际测量了所要测量的 构想或特质的程度 一个测验分数中有多大比 例的变异是来自我们所构想的概念的变异 24 确定构想效度的方法 理论 关于某一心理 特质的假设 设计编制 测验 施测并分析得出结果 相符程度相符程度 25 确定构想效度的方法 n内部一致性 n与同类测验的相关 相容效度或称会聚效度 n发展变化 年龄

10、教育或训练 n因素分析 因素效度 n多特质 多方法 MTMM n结构方程模型 n认知心理学的方法 n收集实证资料 26 27 效标效度 被预测的行为是衡量测验是否有效的标准 简称效标 所谓效标效度 就是考查测验分 数与效标的关系 看测验对我们感兴趣的行为 预测得如何 因为效标效度需要有实际证据 所以又叫实证效度或 统计效度 根据搜集效标的时间 可以将效标效度分 为预测效度和同时效度 28 效标选取的条件 n相关性 n有效性 n无污染 n客观性 n实用性 29 效标效度的估计方法 n相关法 确定效标效度最常用的方法是计算测验分 数与效标测量的相关 这个相关系数为效度系 数 根据变量的性质不同 可

11、分别采用积差相 关 等级相关法 二列相关法等 30 n两列变量是正态连续变量时 用积差相关 n当测验分数是连续变量 效标分数为二分变量 如通过与未通过 时 用点二列相关公式计 算 31 n当测验分数与效标分数都是连续变量 但效标 分数需要人为地一分为二时 如及格与不及格 用二列相关公式 32 n当测验分数为连续变量 效标分数为多种类别 的等级评定 如优良中差 时 可用多列相关 法计算 33 n效度系数的平方表示效标分数的变异数由测验 分数的变异数决定的百分比 或者说表示测验 和效标这两组分数的共变部分 如 当 rxy 0 60时 我们可以说效标分数中有36 的 变异来自测验分数的变异 或者说有

12、36 的变 异为两个测验共同具有 说的更通俗点 在效 标分数中36 的方差可以由测验分数正确地预 测到 34 n效度系数越高表明测验越有效 预测能力越强 一般来说 效度系数 即相关系数 只要达 到统计上的显著性水平 测验工具就是有效的 35 相关法的优点是 n提供了预测源与效标间的数量关系 n可利用回归方程式来预测每个人的效标分数 相关法的缺点是 n如果预测源与效标之间不是直线关系 便会低 估测验的效度 n不能提供关于取舍正确性的指标 36 n分组法 相关法是考察同一组被试的测验分数与效 标成绩之间的一致性程度 如果一致性程度高 测验是有效的 分组法则是考察测验分数能 不能区分开由效标的不同成

13、绩所定义的团体 如果能区分开 这个测验是有效的 37 例如某政府机关通过测验录用了一批公务 员 经半年试用期后 根据他们的实际工作成 绩 将这批公务员区分为称职和不称职两组 然后回过头来检查这两组人在测验上的分数是 否有显著差异 如果差异显著 说明这个测验 在录用公务员的选拔性测验中是有效的 38 n预期表法 预期表法式将预测源分数和效标分数制成 双维图表 并将每个变量按水平分成若干档次 然后列出每个档次上的人数百分比 从预期 表我们可以看出效标效度的高低 39 预期表的双向表格中 测验分数排在表的 左边 效标分数排在表的上边 表中数字代表 获得每一类测验分数的人数 或在效标成绩上 可能达到某

14、种标准的人数百分比 只要知道了 某被试的测验分数 就可以从预期表上查看到 某被试取得效标成绩各种等次的可能性的大小 40 表3 1 预期表 大学一年级成绩 ABCDE 高考成绩 高6040 中10204030 低10404040 从右下角到左上角的对 角线上各格中的数字越 大 说明校标效度越高 41 1234 425252525 325252525 225252525 125252525 1234 410192843 319252828 228282519 143281910 r 0 00r 0 00r 0 40r 0 40 42 1234 4172567 37274125 22541277

15、1672571 r 0 80r 0 80 规律 从二者最低一级开始 到二者最高一级的对角线 43 表3 2 瑞文推理测验的预期表 瑞文标准推 理能力测验 一年级数学成绩 D等以上C等以上B等以上 55 60999050 50 54855430 45 497032 40 4452 44 预期表可同时使用于标准参照测验和常模 参照测验 当上面的效标成绩区分为通过和不 通过或及格和不及格两种标准时 就成了标准 参照测验的预期表 用预期表来根据测验成绩预测和解释被试 的效标成绩时 要注意到制成预期表时取样团 体的代表性和样本的大小 一般而言 样本团 体越具有代表性 样本中人数足够多 则预期 的可靠性越

16、高 45 n命中率法 在某些情况下 预测源和效标都是二分的 我们便可以得到一个预测命中表 表3 3 命中表 成功失败 成功A 命中 B 失误 失败C 失误 D 命中 46 效标分数的预测 根据测验的效度系数 就可以根据一个人的 测验分数预测他的效标分数 如果X Y是两列 呈直线关系的变量 只要确定出两者间的回归 方程 就可以从一个变量估计另一个变量 最 简单的回归方程为 为预测的效标分数 a是纵轴上的截距 为斜 率 X为测验分数 47 n要得到回归方程 就必须确定a 这两个常 数 48 标准参照测验的效度 标准参照测验主要用来检验学习结果 看对 指定的内容范围掌握得如何或是否达到某种标 准 因此衡量测验优劣的主要指标是内容效度 确定内容效度的方法对于标准参照测验均适 用 此外 还可以把测验项目和指定内容范围 相符的百分比以及不同专家判断的一致性作为 内容效度的指标 此外可用命中率法或预期表 法来估计其效度 49 影响效度的因素 n测验本身 q项目信度 q项目数量 n效标 n样本的代表性 n干涉变量 50 SCL 90的因子及题目 51 躯体化因素 n1头痛 n4头晕或晕倒 n12 胸痛

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号