文档详情

项目反应理论简介

m****
实名认证
店铺
DOC
21.50KB
约6页
文档ID:487508689
项目反应理论简介_第1页
1/6

项目反应理论简介摘 要:项目反应理论(IRT)是近三十年发展起来的一种比较先 进的心理与教育测验理论,受到国内外许多学者和专家的关注与经 典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越 性关键词:经典测验理论;项目反应理论;项目特征曲线;罗氏模型 一、引言 目前,考试系统题库的建立主要基于两种指导理论:经典测验理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)二者都有一套完整的试题分析指标体系和评价标准但经过长 期实践,经典测验理论显示出某些难以克服的缺点,如由不同测试项 组成的测验其结果无法比较,数据没有等距性,测量结果容易受到样 本的影响,以及多个变量不易同时处理等针对这些,现代测验理论 应运而生在国外已广泛应用于教育测验领域,如 GRE,GMAT, TOEFL等测验,近年来也扩展应用到其他学科领域的测验评估°Baker (2001)认为,在经典测验理论指导下,测试学家关心的是被试的测试 得分,即每个正确测试项的分值总和而项目反应理论的关注重点则 是被试是否答对每个测试项,而不是被试的测试总分。

项目反应理论 和经典测验理论在数学模式、基本假设和测验可靠程度的估计指标等 方面都存在着明显的差别与经典测验理论相比,项目反应理论在较 强的前提假设下,有更多的优越性项目反应理论 项目反应理论,也称潜在特质理论、潜在特质模型、强真值理论,是 一种现代心理测量理论,是一系列心理统计学模型的总称,是针对经 典测量理论的局限性提出来的项目反应理论是用来分析考试成绩或 者问卷调查数据的数学模型,这些模型的目标是来确定潜在心理特征 (latent trait)是否可以通过测试题被反应出来,以及测试题和被试之 间的互动关系项目反应理论假设被试对项目的反应能体现他的潜在 特质(Baker, 2001)根据被试回答测试项的情况,通过对项目特征 函数的运算,来推测被试的能力 项目反应理论的产生是以经典测验理论为前提的,其自身的发展结合 了多人的努力理查森于1936年首次提出了 IRT的参数估计方法; 劳勒于1944年提出了一系列关于IRT领域中基本的理论问题,推出 了很有价值的参数估计方法;格特曼于 1944 年提出了“无误差模型” (一种确定性模型,即理想量表项目),这是后来 IRT 中项目特征曲 线(item characteristic curve, ICC )的雏形(胡维芳,2005)。

项目特 征曲线是IRT的核心,IRT其他理论都是建立在ICC之上(Baker, 2001) ICC 是由塔克于 1946 年首次提出,他把被试的某些纬度(如 能力、年龄)看作是自变量,考生对于某个测验项目的反应看作是因 变量,在直角坐标系中作出散点图,然后用一条光滑的曲线拟合这些 数据,这样就得到了 ICC当然,对于IRT贡献最大的是美国测量专 家洛德 1952 年洛德在其博士论文《关于测验分数的一个理论》中, 第一次对项目反应理论作了系统的阐述(当时他称其为项目特征曲线 理论,后改名为项目反应理论)通常将此看作是项目反应理论诞生 的标志1968 年洛德和诺维克在伯恩波姆的名著《心理测验分数的 统计理论》中以四章的篇幅详细地阐述了项目反应理论中具有二、三 参数的罗吉斯模型和正态卵形模型的数学问题,至此,构成了项目反 应理论的基本体系20 世纪 70、80 年代,项目反应理论获得迅猛发 展,不论是基础理论与方法的研究,还是解决重大测验问题的应用研 究,抑或是更实用的计算机程序的编制都取得了巨大的新成果 项目反应理论的基本思想是确定被试的潜在特质和他们对于项目的 反应之间的关系,被试的表现和这组潜在特质之间的关系,可通过一 条连续严格递增的函数来加以诠释,此函数称为项目特征函数,而把 不同能力的被试在某测试项的得分期望连结成线,此曲线称为项目特 征曲线(ICC)。

这种关系的数学表现形式就是“项目反应模型”但 这种模型是概率性模型确切地讲,项目反应模型表示的是被试潜在 能力和被试能正确答对测试项的概率之间关系的数学形式从这个角 度来讲,项目反应理论的核心就是数学模型的建立和对模型中各个参 数的估计为了定量地描述被试对于测试项的反应,测量学家们提出 了各种各样的模型一般认为,罗吉斯模型和正太卵形模型是得到普 遍应用的两个模型下面以罗吉斯模型为例,简单介绍以罗吉斯数学 模 型 为基础的 三种 不同模 型 IRT 有三个项 目 参数 ,即难度(difficulty)、区分度(discrimination)和猜测系数(guessing)根据 不同参数,特征函数可分为三种参数模型:第一,单参数模型(one-parameter model),也称罗氏模型(Rasch model),在这个模型下只包括难度,且区分度恒定为1第二,双参数模型(two-parameter model),包括难度和区分度第三,三参数模型(three-parameter model),包括难度、区分度和猜 测参数若观察 ICC 图表,我们可以看到: 与经典测验理论相比,项目反应理论是建立在强假设基础上的。

IRT 有三个基本假设:第一,潜在特质空间的单维性假设,是指组成某个 测验的所有测试项都是测量同一潜在特质(俞晓琳, 1998);第二, 项目特征曲线假设,是指被试对项目的正确反应概率与其潜在能力之 间存在函数关系,其基本模型为罗吉斯函数(logistic function)第三, 局部独立性假设,是指项目参数的估计值独立于被试,即多个被试的 不同能力水平不影响项目参数;同时,被试潜在能力与测试项的难易 度无关,即不同难度的测试项都能测量出同一个被试的同一潜在能 力基于这些基本假设,项目反应理论表现出了比经典测试理论更大的优 越性第一, IRT 在估计被试能力时,更考虑被试的反应组型,因此 对于原始得分相同但反应组型不同的被试,得到的往往是不同的能力 估计值,这一特性是CTT所无法比拟的在CTT中,原始得分相同 的被试,其能力估计值也被认为相同第二,项目反应模型的项目参 数都是不变的项目参数不会因被试样本或项目库的变化而发生改 变,但 CTT 提供的项目统计量、项目难度和鉴别力等都是依赖于被 试样组第三,IRT可以针对每个被试提出其能力估计值的测量误差 指标,而不是以一个笼统的标准误来代表测量误差,因此能够比较精 确地断定每个被试能力估计值的误差范围。

第四,IRT提出的项目信 息函数和测验信息函数的概念,可以更直接地用来评定个别项目或整 份测验的测量误差,这比传统意义上的“信度”概念更科学、更有效 第五,IRT把被试能力和项目难度放在同一量表上,这使得计算机自 适应考试成为可能题库质量高低的一个重要标志是题库中测试项参数的完备性与准确 性CTT题库的计量技术参数主要是难度、区分度、猜测度,IRT题 库的计量技术参数除这三个外,还增加了测试项信息函数把测试项 信息函数作为技术参数存入题库是IRT独有的,提高了题库参数的完 备性和题库管理的可控性另外,参数准确性也是题库质量的重要条 件在 CTT 的题库建设中,建题库者力求测试项参数的准确性,但 CTT测试项参数的估计严重依赖于样本,这给维持参数的准确性带来 了困难在IRT中,由于测试项参数具有跨群体不变性等特点,使测 试项参数更具准确性测验编制的一个重要目标是要使测验误差达到最小在IRT中,可以 预先规定在特质量表上所有值的最大允许误差,然后利用公式求出所 有水平值上的最小允许信息量,形成一个信息函数这样,测验中用 较少的试题就可以达到不超过允许误差的要求,提高了测验的效率 标准参照测验的编制有两条原则:一是准确划定合格的分数线,二是 要尽量降低对被试合格与不合格的误判率。

项目反应理论在备有题库 条件下组拼标准参照测验可以比较理想地实现这两条原则随着计算机技术的普及和IRT的发展,计算机自适应测验正日益成为 国际上大型测验的主流由于 CAT 具有节省时间,安全性好以及可 以及时提供被试成绩等优点,被迅速应用到多个领域计算机化自适 应测验是当今测验技术的最高水平,也是项目反应理论最有特色的应 用三、小结 项目反应理论是当前国际上最先进的教育和心理测量理论经典测验 理论显示出这些难以克服的缺点,如由不同测试项组成的测验其结果 无法比较,数据没有等距性,测量结果容易受到样本的影响,以及多 个变量不易同时处理等,项目反应理论都能很有效地克服,表现出巨 大的优越性但是,它也存在一些问题除了该理论本身要求研究者 具有很高的统计学背景之外,其问题还表现在该理论的基本假设由 于目前还不可能彻底查明使用数据满足假设的精确度,因为对于表面 上满足了假设的数据而言,只有当从项目反应理论中所作出的预言能 独立地加以证实后,才能进一步验证该理论下的基本假设不管怎样, 项目反应理论还是朝着完善和成熟而不断前进着参考文献:[1]Baker, Frank B.The Basics of Item Response Theory[C].ERIC Clearinghouse on Assessment and Evaluation, College Park, MD.2001. [2] 胡维芳.论项目反应理论J].高等理科教育,2005,(3).⑶俞晓琳.项目反应理论与经典测验理论之比较[J].南京师大学报:社 会科学版,1998,(4).[4]翁伟斌,等.关于项目反应理论试题参数的估计J].教育发展研究,2004,(6).。

下载提示
相似文档
正为您匹配相似的精品文档