计算机辅助教育测量与评价教学课件 蔡旻君 第1章

上传人:w****i 文档编号:94557122 上传时间:2019-08-08 格式:PPT 页数:41 大小:265KB
返回 下载 相关 举报
计算机辅助教育测量与评价教学课件 蔡旻君 第1章_第1页
第1页 / 共41页
计算机辅助教育测量与评价教学课件 蔡旻君 第1章_第2页
第2页 / 共41页
计算机辅助教育测量与评价教学课件 蔡旻君 第1章_第3页
第3页 / 共41页
计算机辅助教育测量与评价教学课件 蔡旻君 第1章_第4页
第4页 / 共41页
计算机辅助教育测量与评价教学课件 蔡旻君 第1章_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《计算机辅助教育测量与评价教学课件 蔡旻君 第1章》由会员分享,可在线阅读,更多相关《计算机辅助教育测量与评价教学课件 蔡旻君 第1章(41页珍藏版)》请在金锄头文库上搜索。

1、中国水利水电出版社,计算机辅助教育测量与评价,21世纪高等院校精品规划教材,蔡旻君 刘仁云 主编,中国水利水电出版社,第一章 计算机辅助教育测量与评价概述,目录,1.1 教育测量与评价的产生 1.2 计算机辅助评价的定义与分类 1.3 计算机辅助评价的发展 1.4 第四代教育评价的兴起,1.1 教育测量与评价的产生,1.1.1 教育测验的兴起 1.1.2 美国的教育测验运动 1.1.3 “八年研究”与教育评价的诞生,教育测验的兴起,中国古代科举考试制度对世界教育、政治、文化,尤其是考试制度产生过重大的影响。 在教育界引起人们对测验问题以极大关注的是著名的莱斯(JMRice)拼字测验。,美国的教

2、育测验运动,教育测验之所以在本世纪二十年代形成 一种运动,表面是针对论文或考试不客观, 实际上,有更为深刻的原因 : 自然科学的发展 个别差异的研究与统计学在教育上的运用 对特殊儿童的研究,美国的教育测验运动,美国的教育测验运动的发展可分为以 下三个时期: 19041915年的开拓期 19151930年的兴盛期 19301940年教育测验运动的批判期,“八年研究”与教育评价的诞生,为了解决高中课程及教学问题,美国 进步主义教育协会负责人艾钦于1933 1940年期间领导了一项长达八年之久的中学 课程改革运动,这就是美国教育史上著名的 “八年研究”,“八年研究”与教育评价的诞生,为了评价其研究成

3、果,组成了以泰勒 为领导的评价委员会。通过这场研究,泰 勒和他的同事正式提出了教育评价的概 念,即教育评价就是衡量实际活动达到教 育目标的程度,测验是它的手段。,“八年研究”与教育评价的诞生,同时,还提出了评价的原则和方法, 其基本思想是: 教育是改变人的行动方式的过程; 教育目标是各种行动方式的变化; 教育能够根据对该目标实际完成情况的分析进行评价;,“八年研究”与教育评价的诞生,人的行动是复杂的,所以要从各方面进行评价,它不仅是分析的,而且也是综合的; 作为评价方法仅仅靠用纸和笔的测验是不充分的,应该采用包括观察行为在内的更为广泛的方法。,“八年研究”与教育评价的诞生,表1.1 新旧课程优

4、劣之评价比较,1.2 计算机辅助评价的定义与分类,1.2.1 计算机辅助评价(CAA)的定义 1.2.2 计算机辅助评价(CAA)的分类,计算机辅助评价(CAA)的定义,计算机技术和教育测量与评价思想的融合促 进了计算机辅助评价(Computer-Assisted Assessment,简写为CAA)的发展,引发了评价 内容、方法和形式的深刻变革。简单地说,凡是 借助于计算机程序、软件和设备进行的测试和评 价都属于计算机辅助评价的研究领域。,计算机辅助评价(CAA)的定义,计算机辅助评价是指在评价学习者的知识、技 能和能力的过程中引入计算机作为工具或手段,主 要表现在以下几方面: 在测试的过程

5、中,传递材料、评分以及对测试结果进行分析; 比较并分析通过试卷搜集到的数据; 记录并分析学习者的成就水平,生成测评报告; 通过网络比较、分析和传送测评信息。,计算机辅助评价(CAA)的定义,就目前应用现状来看,CAA支持的评价类型主 要包括下面几种: 诊断性,目的是判断学习者对某个主题的预备知识的掌握程度。 自测,学习者检查自己对某个概念或术语的理解程度。,计算机辅助评价(CAA)的定义,形成性,目的是提供反馈来指导学习者的学习,这些反馈表明了学习者对某个主题的知识、技能理解和掌握的程度。在CAA中,形成性评价通常采取客观题的形式,在测评的过程中或者结束立即给出提示和反馈。 总结性,总结性评价

6、能够给出量化分数,并对学习者在某个领域的成绩做出判断。总结性评价通常是正式的、有组织且有监考的评价形式。,计算机辅助评价(CAA)的分类,按传递测评内容的手段进行分类,可以分 为以下三类: 基于试卷的测评 基于计算机的测评 基于网络的在线测评,计算机辅助评价(CAA)的分类,按测评依据的理论模型进行分类 ,可以分 为以下两类: 经典测验理论 项目反应理论,计算机辅助评价(CAA)的分类,与经典测验理论相比,项目反应理论具有 以下两个优点: 题目参数估计更准确; 根据信息函数可从题库中抽取符合被试能力的题目进行测试。,计算机辅助评价(CAA)的分类,按照测评的题型进行分类 ,可以分为以下 三类:

7、 客观题测评 操作题测评 主观题测评,计算机辅助评价(CAA)的分类,客观性测验具有以下一些优点: 测评是客观的,评价结果具有比较高的可信度; 可以快速地给出评价结果; 综合应用多种媒体(图像、视频、音频等),试题的表现形式丰富多样; 在测试的过程中或者测试结束后,可以自动地提供相关的反馈;,计算机辅助评价(CAA)的分类,可以从题库中随机地选择题目; 给学习者提供灵活的自测机会; 可自动阅卷,节省时间,尤其是对大批量学生能快速测评; 从试题的呈现、学生答题到阅卷都可以完全由计算机软件完成,实现无纸化考试。,1.3 计算机辅助评价的发展,1.3.1 从经典测验(CTT)到项目反应 理论(IRT

8、) 1.3.2 从常模参照测验到标准参照测验 1.3.3 从学业成就到能力素质测验 1.3.4 从终结性评价到形成性评价,从经典测验(CTT)到项目反应理论(IRT),经典测量理论、概化理论、项目反应理论是 当今主流。一般说来,现在自编量表的测量理论 基础都是这三大理论。经典测验理论对测验的分 析直观、具体、适用性广;概化理论对测验的宏 观分析能力强,适用于测验分析研究;项目反应 理论在控制测验编制质量上,原理科学、计量精 确,有广泛的发展前途。,从经典测验(CTT)到项目反应理论(IRT),经典测量理论(Classical Test Theory,简称 CTT)形成于19世纪末,主要是以真实

9、分数模型 为基础,借用普通物理测量的基本假设,采用的 计算公式简单明了、浅显易懂,能够对测试结果 做出合理的解释,并且可操作性强,便于在实际 测验情境(尤其是小规模资料)中实施,能满足 人们对将测验作为一种选拔工具的需要。,从经典测验(CTT)到项目反应理论(IRT),概化理论(Generalizability Theory, 简称GT)较之经典测量理论具有独特的优 势。它利用方差分析将各类误差进行分 解,可辨明多种误差来源,从而揭示了测 验变异的影响因素和大小。,从经典测验(CTT)到项目反应理论(IRT),项目反应理论(Item ResponseTheory, 简称IRT)的发展是建立在潜

10、在特质理论的 基础之上的,其主要内容就是揭示被试测 验上的反应行为与测验所测的被试潜在特 质之间的关系,这种关系的形象描写就是 项目特征曲线。,从常模参照测验到标准参照测验,尽管在1913年,桑代克就已经提出了标准 参照测验,但由于受重视个体差异文化的影响, 当时大多数的教育成就测验都是用来比较某个学 生与其他学生的成绩,直到20世纪后半叶,标准 参照测验得以快速发展。布卢姆的掌握学习理论 为标准参照测验的发展提供了原动力。,从学业成就到能力素质测验,1993年 “少年儿童测验的应用国际进步 之路” 宗旨是促进全世界少年儿童的教育发展和 教育机会的改善,促进有效的、真正为教育实践 服务的评价政

11、策的制定和推行,号召不发达国家 开发测验,开展评价,同时倡导发达国家改进传 统的评价做法,扩大评价的应用。,从终结性评价到形成性评价,终结性评价的目的并不是为了帮助参与方案 的个体学生,而是为了决定方案是成功还是失 败,是继续使用、修改还是放弃。形成性评价与 测验反馈和诊断性功能密不可分。当学生完成了 教学的每一个单元或阶段,测验成绩就能够反映 他们掌握知识的情况,并告知他们是否达到了课 程目标,以及他们在哪些方面需要加强。在教师 的帮助下,可以使用新的补习材料或方法来促进 学习。,1.4 第四代教育评价的兴起,1.4.1 第四代教育评价的内涵 1.4.2 第四代教育评价的主要方法 1.4.3

12、 将评价融入学习环境设计,第四代教育评价的内涵,“第四代教育评价”的教育评价理论,它是由印地安纳 大学教育学院教授枯巴(Egong Cuba)和维德比尔特大 学副教授林肯(Yvonna Session Lincoln)创立的。他们 于1989年合作出版了第四代教育评价一书,较为系 统地论述了他们关于教育评价的观点,依据各种评价出 现的先后时间顺序,将教育评价分为四代,并着重阐述 了他们所定义的第四代教育评价。他们把教育评价划分 为四个发展阶段,认为每一个阶段各有一种理论构建。,第四代教育评价的内涵,第一代教育评价被称为教育评价的“测量时代”,这一时代从1900到1930年。主要标志是测量理论的

13、形成和测量技术手段的大量应用,以追求评价结果的数量化、客观化为主要目的。 第二代教育评价被称为教育评价的“描述时代”。这一时代从1930年到1940年。第二代教育评价的主要特征是对评价结果进行描述。 第三代教育评价被称为教育评价的“判断时代”,大约从1950年前后开始,到60年代初期。这一代教育评价的特点,是把前两代没有涉及到的“价值判断”引进了教育评价,并视之为教育评价的关键,评价者的任务不仅是要运用一定的测量手段搜集评价信息,而且还要制定判断价值的目标与评价标准,运用一定手段进行价值判断。,第四代教育评价的内涵,第四代教育评价的内容可以概括为以下 几个方面: 心理构建论。 价值协调论。 评

14、价结果认同论。 应答性模式。 对学习资源与学习过程关注程度增大。,第四代教育评价的主要方法,档案袋评价 档案袋评价(portfolio assessment) 是一种综合性的过程评价形式。随着当代 信息技术的广泛应用,出现了各种丰富多 彩的电子档案袋新形式,推动了档案袋评 价的迅速发展。,第四代教育评价的主要方法,学习契约 学习契约(learning contract)是学生 与教师共同设计的一种契约,契约中界定 了学生的学习目标、达成学习目标的方 法、学习活动进行的时间以及评定学习活 动的标准等。,第四代教育评价的主要方法,反思表评价 反思表(reflective form)是以问题或 评价

15、条目组成的表单,可以通过预先设计 好的问题,使学习者了解到自己学习的完 成情况,有效地启发学习者的反思,从而 增强反思力和自主学习能力。,第四代教育评价的主要方法,表现评定 表现评定(performance assessment) 就是通过学生所完成的综合性的、真实的 任务来对学生进行评定,要求学生运用他 们的知识和技能去完成综合的、有意义的 任务。,第四代教育评价的主要方法,动态评定 动态评定(dynamic assessment)有两层含 义,“一是跨越多个时间点观察评定学生的进步 与改变情形,了解学生动态认知历程与认知能力 变化的特点和潜能。二是评价者与被评价者之间 产生大量的互动,强调评价与教学结合,实施个 体化的诊断评价与教学补救。”一般我们运用更 多的是第二种含义的动态评定。,将评价融入学习环境的设计,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号