教育统计与测评技术教案_小学教育-小学学案

上传人:ni****g 文档编号:568024477 上传时间:2024-07-23 格式:PDF 页数:27 大小:2.33MB
返回 下载 相关 举报
教育统计与测评技术教案_小学教育-小学学案_第1页
第1页 / 共27页
教育统计与测评技术教案_小学教育-小学学案_第2页
第2页 / 共27页
教育统计与测评技术教案_小学教育-小学学案_第3页
第3页 / 共27页
教育统计与测评技术教案_小学教育-小学学案_第4页
第4页 / 共27页
教育统计与测评技术教案_小学教育-小学学案_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《教育统计与测评技术教案_小学教育-小学学案》由会员分享,可在线阅读,更多相关《教育统计与测评技术教案_小学教育-小学学案(27页珍藏版)》请在金锄头文库上搜索。

1、学习必备 欢迎下载 教育统计与测评技术教案 总论 教育统计与测评技术实际上涵盖三门课程:教育统计、教育测量与教育评价。将教育统计、教育测量与教育评价联系起来进行研究与探讨,这不仅符合三门学科之间的逻辑关系,更有利于整合三门学科的优势,充分发挥它们在教育管理、教育教学实践、教育研究等领域中的作用。无论是从教育管理、教育教学实践的层面,还是从教育科学研究的层面,教育统计与教育测量都是开展教育评价不可或缺的环节, 它们是教育评价获得评价信息的必要手段和有力工具。 教育测量侧重于为教育评价提供反映事物本质状态的原始数据, 教育统计着力于对这些数据进行整理、分析、描述与推断,从而提供反映事物本质状态的统

2、计数据,依据这些统计数据,教育评价才能作出科学、客观、准确的价值判断。所以,三者的关系是: 测量 统计 评价 其中,测量是前提,统计是关键,评价是目标。但从学知识的角度来看,了解统计知识则是测量的前提,而掌据测量知识又是评价的前提,所以我们按统计、测量、评价的顺序来开展教学。 教育统计 第一章 概述 一、统计学概述 (一)何为统计? 统:汇总起来;总括;全部。 计:计算。 统计:将数据汇总起来加以计算,即对某一现象有关的数据的搜集、汇总、整理、计算和分析等。统:搜集、汇总;计:整理、计算、分析。 统计学分为研究统计理论的数理统计学和研究统计实践的应用统计学两部分。数理统计学对统计原理和统计方法

3、进行证明,应用统计学是统计原理和方法就应用于各个实践领域,如:金融统计学、心理统计学、教育统计学。 教育统计学是将统计原理和方法用来研究教育问题的一门应用科学。它研究如何收集、整理、分析由教育调查和教育实验所获得的数据资料,并以此为依据,进行科学推断,提示教育现象所蕴含的客观规律的一门科学。 (二)统计为何? 一为描述,对事物的现状等加以描述(比如,对某地的男女教师的比率进行描述) ;二为推断:对事物的总体性质、特点、发展趋势等加以推断(比如,根据样本信息推断总体信息) 。 (三)如何统计? 二、教育统计学概述 (一)教育统计的过程 1教育统计资料的收集 教育统计资料的来源:观察、调查、实验以

4、及文献资料,其中主要资料来自于教育调查和教育实验。 全面性原则、准确性原则、客观性原则 2教育统计资料的整理 用统计表和统计图对资料分组归类、检查核实原始数据、计算描述数据的特征量等 3教育统计资料的分析 对整理后的数据进行对照比较、分析新情况、发现新问题、揭示教育的规律和发展趋势,学习必备 欢迎下载 并将分析研究资料的结果写成分析报告。 (二)教育统计学的初步概念 比如,要对某地的教师情况作一研究,那该地的教师就是被试。被试有多方面的性质,有的是恒定不变的, 称常量; 有的变化的, 称为变量。 要对被试的整体中的每一个进行研究,在时间精力上有难度,这就需要从研究对象中抽取一部分出来研究,这一

5、过程称为抽样,抽出来的部分称为样本。然后,根据样本的数据去推测总体的数据,样本的数据称为统计量,由样本推测出来的总体的数据,称为参数。抽样一般以随机的进行,抽出来的样本的数据可能会与总体有一定的误差。 又如, 要对中学生的课堂参与度与其学习成绩之间的关系进行研究。 1 被试 被试即为被研究者的简称,被试通常也称为受试或研究对象。如:实验被试、观察被试。 2 常量与变量 在教育研究中,一些量是可以变化的,我们将之称为变量,这些量是在性质、数量上可以变化的量以及测量或操纵的因子或条件, 如学生年龄、 学习内容、 学习成绩、 学习能力等。 与之相反,一些量是固定不变的,我们将之称为常量或常数,如圆周

6、率、重力等。 变量依其相互关系,可分为自变量和因变量。 自变量是自身变化的量,而因变量是因自变量变而随之变的量,常将自变量作为实验因素,又称实验因子,它是由实验者操纵的。因变量是一种假定的结果变量,是实验对象在实验因素和其他控制变量的作用下的反应。比如,将学生的课堂参与度设为自变量,将学生的学习成绩设为因变量。自变量与因变量的关系可以用下式表示: y=f(x) 变量依其性质不同,可分为品质变量和数量变量。 品质变量只说明事物的属性、类别以及等级上的特征,不表示事特之间差异的大小。如学生性别、学生品德(优、良、中、差) 。数量变量则用来说明事物数量上的差异,比如,学生身高、学生学习成绩。 根据变

7、量是否成为某特定研究所操作的因子或条件,变量可分为研究变量与非研究变量。 研究变量指特定研究所要操作的变量,非研究变量指特定研究所操作变量以外的变量,也称为无关变量。比如,研究学生课堂参与度与学习成绩的关系,学生课程参与度就是研究变量,而教材、教师等就是非研究变量。 变量根据其所表示的数据的性质,可分为称名变量、顺序变量、等距变量和比率变量。 3 抽样、样本、随机 在教育研究中,所研究的总体包含的数目往往很多,不宜对总体全部进行研究。例如,我们研究全国中学生课堂参与度与其学习成绩的关系, 全国的中学生太多, 对这一总体各个学生的课堂参与度都进行研究是很费力、很费时、很困难的,而且不是很现实,为

8、减少研究的困难与麻烦, 我们采取从中抽取一部分学生进行研究。 这种从总体中抽出一部分个体的方法,我们称之为抽样或取样。所抽出的部分称之为样本。样本中所含的个体的数目,称为样本的容量。如果容量大于 30,一般称之为大样本;容量小于或等于 30,一般称之为小样本。抽样是从总体中抽取一部分进行研究, 并根据样本研究结果来推断总体的特征或规律。 要确保推断的准确性, 样本要能代表总体, 抽样应遵循随机原则, 否则所抽取的样本不具代表性。 随机即随机现象,具有以下三种特性:第一,一次试验有多种可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。比如

9、,抛硬币,彩票。这种现象称为随机现象。随机现象的每一种结果叫做一个随机事件。表示随机现象各种结果的变量称为随机变量,统计处理的变量都是随机变量。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我

10、们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (1)单纯随机抽样 单纯随机抽样是从总体中完全随机地抽取个体的一种方法。 单纯随机抽样可通过抽签以及随机数目表来实现。 (2)机械抽样 机械抽样, 又称为系统抽样或等距抽样, 是指将总体中的各个个体按一个与研究问题没有直接关系的标志(如时间、地区等)加以排列,然后依据固定顺序或固定间距进行抽样。比如,要了解某中学高一新生的英语水平,设该校该年级有 1000 名学生,要抽取 100 人,可先将这 1000 名学生按报名先后顺序

11、(学号)进行排序,并从 1 至 1000 进行编号,然后按1,11,21号码的顺序和间隔抽取样本。 机械抽样比单纯随机抽样更能保证抽到的个体在总体中的分布比较均匀, 而单纯抽样比机械抽样的随机性强, 因为单纯随机抽样可以由总本内所有的个体组成任何可能的样本, 而机械抽样对上例而言,只有 10 个可能样本。 在实践应用中, 可以将机械抽样和随机抽样结合起来使用, 如上例先按机械抽样原则进行分组,再按单纯随机抽样原则在组内进行抽样。 (3)分层抽样 分层抽样是把总体中各个个体按照一定标志分为不同类型或层次, 然后从各类型中随机抽取若干个体, 从而构成样本。 将总体按照一定标志分类的基本原则是, 层

12、内之间差异要小,层外之间差异要大,否则就失去分层的意义。例如,对某校友 800 个学生的学习兴趣情况进行调查研究,拟抽取 40 个学生作为样本,即抽样比率为 40/800=1/20。那么,可先根据一定标准将 800 个学生分成优(160) 、良(320 人) 、中(240 人) 、差(80 人)四个部分,然后从各部分中用单纯随机抽样或机械抽样的方法,各抽取 1/20,即从优等中抽取 160 1/20=8(人) ,从良等中抽取 320 1/20=16(人) ,从中等中抽取 240 1/20=12(人) ,从差等中抽取80 1/20=4(人) ,组成一个样本。 (4)整群抽样 整群抽样是以整群为单

13、位而不是以个体为单位来抽取对象的抽样方法。 这种方法的优点是便于组织, 其缺点是代表性较差, 因而采用也较少。 比如, 调查某地中学教师的心理状况,则可将某地所有中学视为若干群体, 然后按随机原则从中抽取几个群体作为样本, 再对选中群体内的所有教师进行调查,这种方法即是整群抽样法。 4 统计量与参数 样本的特征量称为统计量,如样本的平均数、样本的标准差。由样本的统计量去估计,推断出来的相应的总体的特征量,称为参数。 5 误差 误差是测定的观测值与真值之差,误差可以分为随机误差、系统误差和抽样误差三种。 随机误差指由与研究目的无关的难以控制的偶然困素所引起的误差。 比如, 研究过程中遇到地震之类

14、的自然灾害, 又如研究课堂注意力时突然有一美女走进教室。 随机误差无法完全避免,但是我们可以尽可能地缩小随机误差,提高测量和统计的精度。 系统误差指由与研究目的无关的因素所引起的有规律性的误差。 比如, 皮格马利翁效应,又如在调查研究中部分学生往往倾向于选择 “好” 的答案, 而不是根据自己的真实情况作答。引起系统误差的原因很多,我们可以通过认真检查研究的各个方面来控制与消除系统误差。 抽样误差指由于抽样而产生的误差, 抽样误差属于随机误差的范畴, 由于它在统计中非常重要,所以人们将之专门列出。比如,抽样不具代表性。 (三)教育统计学在教育研究中的应用 教育统计学可能用教育观观察、教育调查、教

15、育实验、教育文献研究等的数据归类汇总等,其中主要还是应用于教育调查和教育实验研究。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述

16、一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 1应用于教育调查 教育调查是取得客观的、 真实的可靠资料的一条重要途径。 教育调查的方法和种类较多,就调查的范围分,有全面调查和非全面调查。 全面调查即对全部对象都加以调查, 如对某地区中学生的心理健康进行调查, 对某大学毕业生的社会适应能力进行调查。 全面调查的优点在于可以全面了解某种情况, 不足之处在于费时、费力。 非全面调查即从调查总体中选取一部分个体进行调查, 非全面调查可以节省人力、 财力和时间。非全面调查包括抽样调查、重点调查和典型调查。 (1)抽样调查 前面已讲述 (2)

17、重点调查 重点调查的调查对象在研究总体中所占比重较大, 或比重虽不大, 但在被研究现象的发展中起着重大作用。比如,要调查羌族文化对学校教育的影响,我们就可以重点调查北川和理县的学生,因为绝大多数羌族人都生活在这两个县。又如,要调查四川人的性格特点,我们可以选择成都进行重点调查,因为成都对四川的特点有集中的反映。一般说来,按照调查任务的要求, 凡在部分单位或少数地区能够反映所研究的项目和指标时, 就可采用重点调查。在抽样调查以前, 为了大致了解被调查单位的一般情况可以进行重点调查, 在抽样调查以后,为了深入了解某一单位的情况也可以进行重点调查。 (3)典型调查 典型调查是研究者根据需要选择一部分

18、具有代表性的单位(或个体)进行的调查。典型调查可在较短时间内,用较少的人力、财力和物力,取得较大的效果。比如,要对研究性学习实施情况进行调查研究,别人主要是总结成功经验,而你主要想总结失败教训,你就可以选一个失败的学校作为典型加以研究。 这次新课程改革中对一些新课程开展得很好的学校进行调查研究,也是一种典型调查。搞好典型调查,关键是选好典型,要选好典型,必须将对象按照某种标准分类,然后从每一类型中选出具有代表性的典型个体(或单位) 。 2应用于教育实验 (1)单组实验 单组实验是向一组实验对象施加一个或数个实验因子, 然后测量其发生的变化, 借以确定实验因子的效果。比如,教学方法讲授法与发现法

19、对学生学习成绩的影响。 第一个月 第二个月 一班学生 讲授法 发现法 统计并比较第一个月学生成绩与第二个月学生学习成绩的差异是否显著。 单组实验必须具备以下条件: 第一,后一实验因子与前一实验因子不发生影响; 第二,其他非实验因子所产生的影响在实验前后应保持一致; 第三,测验数据准确可靠。 单组实验的优点是简单易行,缺点是后一实验因子易受前一实验因子的影响。 (2)等组实验 等组实验是指在两组条件相当的情况下,对之施行不同的实验处理的实验方法。比如,要同一个教师所教的两个班中开展学生课堂参与与学习成绩的关系的研究, 一个作为实验班(教学中让学生高度参与) ,一个班作为对照班(教学过程中基本上不

20、让学生参与) 。采用这种实验方法最关键的一点是两组的条件要相当。 要做到这一点, 可采取随机抽样法和测验选择法。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学

21、教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 前测 后测 实验班 不参与 参与 对照班 不参与 不参与 前测要做到两个班的差异不显著, 后测若两个班的差异显著说明是否参与对学习成绩有明显影响,反之则说明无明显影响。 这种实验法虽然克服了单组实验的部分缺点,但它很难做到各组完全相当。 (3)轮组实验 轮组实验是将各实验因子轮换施行于各组, 然后根据每一因子所产生的变化之总和确实实验效果。 假定有甲、乙两组学生,有讲授法和发现法两种教学方法。 假定甲组先进行讲授法教学,然后进行发现法教学。 假定乙组先进行

22、发现法教学,然后进行讲授法教学。 甲组 讲授法 发现法 乙组 发现法 讲授法 将甲组采用讲授法时的学习效果和乙组采用讲授法时的学习效果作为一组, 将甲组采用发现法时的学习效果和乙组采用发现法时的学习效果作为一组, 将两组数据的统计结果进行比较看差异是否显著。 轮组实验是单组实验的变形,对其结果的统计分析仍可采用单组实验的统计方法来处理。具体方法是将把两个实验给放在一起作为一组进行统计分析。 轮组实验的优点是,减少了无关因子的干扰;省去了谋求各组相等的麻烦;一定程度上保证了实验结果的准确可靠。其缺点是,实验次数的增加,使实验的周期相应增加,带来了更多多的人力、物力和时间等的花费。 第二章 描述统

23、计 第一节 统计表与统计图 一、 统计表 统计表是用来表达统计指标与被说明事物之间数量关系的表格。它可以简化统计资料,便于我们分析、比较、计算、记忆资料。统计表的结构包括:标题、表号、标目、线条、数字和表注。 (1)两边不要竖线,中间可要可不要的竖线最好不要 (2)有标号、标题,表的标号、标题在上,图的标号、标题在下 (3)指标分界分明,上、下限标明,组距相等 (4)具有价值性,表中量化内容具有可比性,如百分等级 (5)表的设计要有规律性 统计表的基本格式如下: 表 2.1 统计表的基本格式 (标题) 横纵标目的总标目 纵标目 横标目 数字 (一)简单表 参见书上 18 页表 2.2 (二)分

24、组表 参见书上 18 页表 2.3 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总

25、起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (三)复合表 参见书上 18 页表 2.4 (四)频数分布表 参见书上 19 页表 2.5 二、 统计图 统计图是用来表示统计指标与被说明的事物之间数量关系的图形。 它能使事物的数量关系表达得形象直观,一目了然。一般是根据统计表绘制统计图。统计图的结构包括:标题、图号、标目、图形和图注。统计图的种类的:表示间断变量的统计图(有直条图、圆形图)与表示连续变量的统计图(有线形图、直方图、多过图、累积多边形) 。 (一)直条图 直条图是用条形的高低或横向的长短来比较统计数据的几何图形。 它主要是用来比较性质相似的间断性资料。 直条图按图形

26、中被比资料的组数不同, 可分为单式直条图和复式直条图。参见 20 页图 2.1 和图 2.2。 (二)圆形图 圆形图是反圆按比例分成若干扇形来说明总体结构的几何图形。 它是用来表示间断性资料构成比的图形。圆形的面积表示一组数据的整体,图中扇形表示各组成部分所占的比重。各部的比重一般用百分比表示。参见 21 页图 2.3。 (三)线形图 线形图是用曲线的高低和斜度表现统计数据的几何图形。参见 21 页图 2.4。 (四)直方图 直方图用面积表示频数分布,用各组上下限之间的矩形面积表演示各组频数。参见 22页图 2.5。 (五)多边图 如果把以各组组中值为横坐标, 相应的频数为纵坐标得出的各点以及

27、横轴上两边各增加一个组终点,用折线顺次连接起来,则可以得到多边图。参见 22 页图 2.6。 (六)累积多边图 如果把以各组下限为横坐标, 下限以前相应的各组累积频数为纵坐标得到的各点顺次用平滑曲线连接起来,则可得出累积频数曲线图。参见 23 页图 2.7。 第二节 教育统计的特征量 利用统计表和统计图, 我们可能对数据的整体情况有一个粗略大致的了解, 但对数据的一些具体情况还不胜明了, 也无法对数据进行分析研究。 要进一步把握这些数据并对此进行分析研究,我们还需要求得一些特征量,以此来解释数据的集中趋势、离散程度和相关程度等。 1水平性 整体情况 集中量 单组数据 2离散性 极端情况 差异量

28、 相关、差异区别只是角度不同,本质上一致 3相关性 两组数据的关系 相关量 两个组的数据特征 一、集中量 集中量是代表一组数据典型水平或集中趋势的量。它反映一组数据向某一点集中的情况。常用的集中量有平均数、中位数和众数。平均数(大小) ,中位数(位置) ,众数(频率) (一)平均数 1算术平均数 算术平均数是所有观察值的总和除以总频数所得之商,简称平均数。参见书 24 页 算术平均数的计算方法:原始数据法 频数数据法(当一组数据数目较多,而原始数据又不知道,只育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理

29、教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 知道频数分布表,就可以利用频数分布表来求这组数据的近似值。比如,知道该年级语文期末成绩的频数分布情况,要求该年

30、组语文期末考试的平均分。参见书 25 页) 2加权平均数 加权平均数是不同比重数据(或平均数)的平均数。比如:专家 6(打 80 分) ,领导 5(打 70 分) ,自评 4(打 75 分) ,学生 3(打 60 分) ,家长 2(打 55 分) ,互评 1(打 50 分) 。 求加权平均数的方法:原始数据法和频数分布表法。参见书 26-27页。 3 几何平均数(求增大率或减小率) 几何平均数是 N 个数据连乘的 N 次方根。几何平均数适用于计算具有递增(或递减)性数据的集中量。参见书 28 页。 几何平均数是为了矫正算术平均数 比如,高考人数:5 10 30 60 240 又如,高考人数:1

31、00 200 400,求 2000 年至 2002 年该校高考人数的平均数及年平均增长率。 4 调和平均数 调和平均数是一组数据倒数的算术平均数的倒数, 也称倒数平均数。 调和平均数适用于求平均速率一类问题。参见书 29 页。 算法:倒数和的平均数的倒数 小结:算术平均数表示一组数据的中心或重心位置,可用于各给数据之间集中水平的比较;加权平均数用于求不同比重数据(或平均数)的平均数;几何平均数适用于计算具有递增(或递减)性数据的集中量;调和平均数适用于求平均速率一类的问题。在求平均数时,应根据数据特点和需要,正确选用各种平均数的算法。 (二)中位数 中位数是位于依一定顺序排列的一给数据中央位置

32、的数值,在这一数值上、下各分布着一半频数,常用 Md表示。 对于分布大致对称的数据,中位数与算术平均数十分接近;而当数据分面过偏时,用中位数表示的集中趋势比算术平均数更为合理。 中位数的计算方法:原始数据法(如下) 、频数分布表法(略) 将一组原始数据依大小顺序排列后, 若总频数为奇数, 就以位于中央的数据作为中位数;若总频数为偶数,则以量中间的两个数据的算术平均数作为中位数。参见书 30 页。 (三)众数 在一数列中出现频数最多的一个数值称为众数,常用 Mo表示。如果所有数据项都不相同,就没有众数。 众数的计算方法(略) 小结:在以上三种集中量中,平均数(尤其是算术平均数)集中代表性较好,其

33、次是中位数,然后是众数。 平均数优于中位数和众数的特点为: 第一, 平均数是根据全体数据参与计算得来的,可以作为一组数数据的代表值; 第二, 简明易懂; 第三, 可由无次序的数据直接求出; 第四, 计算公式可用作代数运算; 第五, 较稳定可靠,受抽样影响不很大; 第六, 已知平均数与频数可求出总数。 平均数也有不足之处: 第一, 受极端数据的影响较大; 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育

34、评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 第二, 如有某几个数据不知道就无法求出。 中位数不受极端数据的影响, 尤其是在一个方向上出现较多的极端数值时, 使用中痊数作为集中的代表性较好。 但由于中位数只利用了相对位置的信息, 所以一般情况下它的集中代表性不如平

35、均数。 众数仅利用了数据出现频数最多的信息, 因而在一般情况下其代表性不如平均数和中位数,但在单峰的偏态分布中,众数的代表性较好。 由于平均数具有较多优点,在统计报告中一般都选用平均数。 二、差异量 差异量是描述数据间彼此差异程度的统计量。差异量可分为绝对差异量和相对差异量。 (一)全距 全距是一组数据中最大值与最小值之差,又称极差,用 R 表示。 全距只能反映数据组的两极端值的离差程度,不能反映中间数据的分布情况。 (二)平均差 平均差是每个数据与该组数据的集中量(如算术平均数,中位数)之间的绝对值的算太平均数,一般用符号 AD 表示。参见书 36 页。 平均差考虑到了全部离差,受两极端数值

36、影响小,但计算过程中要用绝对值,不便于代数运算,因而在教育统计中用得不多。 (三)标准差 平均差计算中要用绝对值,为避免这一不足,人们想到对离差加以平方再开方的方法。 一组数据离差(偏离平均数的距离)平方的算术平均数,称之为方差。标准差是方差的平方根。方差用 2表示,标准差用 表示。 标准差的值越大,表明这组数据的差异程度越大;标准差的值越小,表明这组数据越整齐,分布范围越小。参见书 37 页至 38 页。 小结:全距反映了一组数据两端的差异,但不能反映中间数据的分布情况,平均差虽能反映一组数据的整体差异情总,但计算时要用绝对值,不适合代数运算。标准差具有以下优点: (1)标准差反映合部数值的

37、差异情况; (2)标准差适合于代数方法运算; (3)标准差受抽样变动的影响较小。但标准差也有一些缺点,比如,标准差计算较为复杂,结果易受两极端数值的影响。 标准差常与平均数配合使用。参见书 40 页至 41 页。 (四)差异系数 差异系数是指标准差与算术平均数的百分比,差异系数用 CV 表示,它没有单位。 差异系数可用于: 第一,比较单位不同的数据资料的差异程度; 第二,比较单位相同而平均数相差较大的两组数据的差异程度。参见书 41 页至 43 页。 (五)偏态系数(略) 三、 相关量 (一)相关关系的概念 一事物与另一事物之间的关系有两种情况, 一种是两事物毫无联系, 比如, 打嗝与地震;一

38、种是两事物有联系。两事物有联系又分为两种:一种是有严格确定的关系,称之为函数关系;一种是有依存关系,但不是严格确定的关系,称之为相关关系。 比如,智商与学习成绩,老师长得漂亮与喜欢她教的课。 函数关系是一种严格确定的关系, 它反映了事物之间所存在的严格的依存关系, 其特征是现象与现象之间的关系是一一对应的, 它通常可以用一个数学表达式准确表达出来, 属于传统数学研究的范畴。比如,圆周长等圆周率乘以半径的平方。 相关关系是两组变之间的非确性的关系, 它反映了变量之间不十分严格的但依然存在着育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科

39、的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 的依存关系。相关关系是一种大概如此而非绝对如此的关系,相关关系属统计研究的范畴。如

40、教师教得好与学生学习成绩好。 相关分为正相关、负相关和零相关三种。如果两个变量的变化方向一致,即一个变量值变大时,另一个变量值也随之变大,或者一个变量值变小时,另一个变量值也随之变小,称之为正相关。 如果两个变量的变化方向相反, 即一个变量值变大时, 另一个变量值随之变小,或者一个变量变小时,另一个变量值随之变大,称之为负相关。两个变量值之间变化方向无一定规律,称之为零相关。 相关关系一般用相关系数(r)表示,它的范转为- 1r1。由 r 正、负号及绝对值的大小,可以表明两个变量的之间变化的方向和密切程度。 相关系数的计算方法很多,常见的有积差相关、等级相关、点二列相关、二列相关和相关。 (二

41、)积差相关系数 当两个变量都是正态连续变量, 而且两者之间呈线性关系, 表示这两个变量之间的相关称为积差相关。参见书 46 至 48 页。 积差相关的使用条件是: (1)两个变量都是连续性数据; (2)两个变量的总体呈正态分布,或接近正态分布,至少是单峰对称的分布; (3)必须是成对的数据,每对数据之间是相互独立的,而且变量对数 N30; (4)两个变量之间呈线性关系。 (三)等级相关系数 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。 主要包括斯皮尔曼二列等级相关及肯德尔和谐系数。 (四)点二列相关 在两个变量中,其中一个变量是来自正态总体的连续变量,另一个变量为二分量(例如男

42、与女等) ,这时,表示这两个变量之间的相关,称为点二列相关。 (五)二列相关 二列数据都来自正态分布的总体, 但其中一列可以人为地分为二分变量 (例如合格与不合格,高与低) ,这时,表示两个变量之间的相关,称为二列相关。 (六)相关 当二列变量都是二分变量或都可以人为地分成二分变量时, 可用相关来计算它们的相关程度。 第三章 推断统计 第一节 正态分布 正态分布又称常态分布,它是一种应用广泛,且相当重要的概率分布。在实际生活中,凡自然状态下的整数数据都几乎是正态分布。正态分布是一种“两头小,中间大”的分布形态(象一口钟) 。 一、正态曲线 正态分布的曲线方程为: (参见书 63 至 65 页)

43、 ,x(- ,+) 标准分 Z 分,标准分如何得来, 。标准分是一个相对分数,能能够标表示出某一分数的相对位置。 xz22221XeY育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量

44、评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 平均数为 0,标准差为 1 的正态分布曲线称为标准正态分布曲线。 标准正态分布曲线为: 正态曲线有以下特点: 1曲线在 Z=0(即平均数)处为最高点; 2曲线以 Z=0 为轴线,双侧对称; 3曲线从最高点赂左左缓慢下降,并无限延伸,但永不与轴线相交; 4标准正态分布上的平均数为 0,标准差为 1,基线上从 Z=-3到 Z=3 有 6 个标准差的距离,并且多数数据都集中在平均数附近。 5标准正态曲线方程为: 二、正态分布表的使用 正态分布

45、表包括 3 列,第 1 列表示曲线底数即横坐标的位置,用 Z 值表示;第 2 列是纵高 Y,用即曲线的高度;第 3 列是图 32 所示的阴影部分的面积,用 P 表示,P 值是过Z=0 人纵线与过表中某 Z 点人纵线所夹图形的面积比率,即相应区间的随机变量的概率。 Z 值表示某数据在整个数据中的相对位置,Y 值表示在一个点上数据频数的多与寡,P值表示有多少比率的数据落入这一区间。 1已知 Z 值,求面积(参见书 65-66页) 已知 Z 值求面积有三种情况: ,21)(22zezf育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充

46、分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (1)求 Z=0 至某 Z 值的面积。这种情况直接查表可得面积。如,Z=1.5,P=0.4

47、3319;又如,Z=2.9,P=0.49813。 (2)求两个 Z 值之间的面积。 (3)求某 Z 值以上或以下的面积。 2已知面积,求 Z 值(参见书 66 页) 已知面积求 Z 值也有三种情况: (1)求 Z=0 以上或以下某一面积对应的 Z 值。 (2)求与正态曲线上端或下端某一面积对应的 Z 值。 (3)求与正态曲线下中央部位某一面积相对应的 Z 值。 3已知 Z 或 P,求纵线 正态曲线的纵线高度 Y 是横轴上某 Z 值的频率密度 (即概率) , 已知 Z 或 P 都可以通过正态分布表查得 Y 值。 三、正态分布在测验记分方面的应用 1将原始分数转换成标准分数(参见书 67 页) 原

48、始分数往往是绝对分数,可能无法进行比较,无法反映某一分数在群体中的位置,而标准分数则是反映数据在群体中的相对位置,能进行比较。 (考语文 100 分,数学 99 分的例子,语文、数学分数无法进行比较的例子) 标准分数是总体中某个原始分数与平均数之差,再除以标准差所得的商。其公式为: 标准分数的优点: (1)各科标准分的单位是绝对等价的,因此,它具有可加性; (2)标准分数值的正负和大小,可以反映某一考分在总体中所年的地位,因此,它具有可比性; (3)标准分数可以作为舍弃异常数据的依据,如果 Z 的绝对值远大于 3,则可考虑舍弃该原始数据。 标准分的不足:存在多位小数和负值 为克服这一不足,通常

49、将标准分数加以转换。转换的一般形式为: T=KZ+C 2确定录取分数线(参见书 67-68页) 由录取率可以确定录取分数线。 3确定等级评定人数(参见书 68 页) 4品质评定数量化(参见书 68 页) 第二节 总体平均数的估计 这一节要探讨如何用样体的数据,即统计量(如样本平均数、样本标准差)去估计总体的数据,即参数(如总体平均数、总体标准差) 。 一、抽样分布的概念 抽样分布是指某种统计量(如平均数和标准差)的概率分布。 二、平均数抽样分析的几个定理 1从总体中随机抽出容量为 N 的一切可能样本的平均数的平均数等于总体的平均数。用公式表示为: E( X)= 2容量为 n 的平均数在抽样分布

50、上的标准差等于总体标准差除以 n 的方根。 xz育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统

51、计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 3.从正态总体中, 随机抽取的容量为 n 的一切可能样本平均数的分布也呈正态分布; 即使总体不呈正态分布,如果样本容量较大,则样本平均数的抽样分布也接近于正态分布。 三、总体平均数的参数估计 总体平均数的参数估计是指由样本平均数对总体平均数进行的估计。 它分为点估计和区间估计。 点估计是指用某一样本的平均数的值为估计总体平均数的值。 区间估计是指以样本平均数的抽样分布为理论依据, 按一定要求, 由样本平均数的值来估计总体平均数所在的区间范围。 1总体标准差已知或总体标准差虽未知,但 n30(参见书 70-71 页) 2总

52、体标准差未知且 n30(参见书 71-72 页) 第三节 几种常用统计检验方法 一、统计检验的意义 在教育研究中,通过教育调查和教育实验所获得的样本数据经常遇到有差异。 (比如,通过调查发现所抽取的样本中高一男生的数学成绩优于女生) 但这种差异是来自于真正的总体差异, 还是来自于总体本身无差异而是抽样误差造成的差异呢?对于这一问题, 需要进行统计检验。统计检验的一个重要内容就是要看差异是否显著,即进行差异显著性检验。检验差异是否显著,需要一个标准来衡量。在所设定的标准下,如果检验的结果属于差异显著,那就意味着两个统计量来自两个有差异的总体; 如果检验的结果属于差异不显著, 那就意味着两个统计来

53、自一个总体或两个没有差异的总体,或者说这种差异是由抽样误差所造成。 统计检验的核心思想是反证法。 统计结果有无差异必须一定的标准去衡量。一般来说,大家习以概率 P5% 和 P1% 这两个标准来衡量。5% 和 1% 等概率称为显著性水平,记作 。 二、假设检验的步骤 假设检验的一般步骤: (1)提出原假设 H0,即零假设; (2)选择和计算教育统计量; (3)对结定的显著性水平 确定临界值。 (4)将统计量计算的结果与临界值比较,从而决定拒绝还是接受原假设。 三、统计检验的方法 统计检验有 Z检验、t 检验、F检验、x2检验 (一)Z检验 1. 单总体 Z检验(参见书 74 页) 单总体 Z检验

54、是检验一个样本平均数与一个已知的总体平均数的差异是否显著。 2双总体 Z检验(参见书 75 至 76 页) 双总体 Z检验是检验两个样本平均数各自代表的总体的差异是否显著。 (二)t 检验 当总体呈正态分布,如果总体标准差未知,而且样本容量 n30, 那么这时一切可能的样本平均数与总体平均数的离差统计量呈 t 分布。 1单总体 t 检验(参见书 76 至 77 页) 单总体 t 检验是检验一个样本平均数与一已知的总体平均数的差异是否显著。 2双总体 t 检验(参见书 77 至 78 页) 双总体 t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。 小结:单总体:已知时,用 Z检验

55、 未知时,用 t 检验 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算

56、即对某一现象有关的数据的搜集汇学习必备 欢迎下载 双总体:1,2已知,且是独立样本时,用 Z检验 1,2未知,且是独立大样本时,用 Z检验 1,2未知,且是独立小样本时,用 t 检验 1,2未知,且是相关样本时,用 t 检验 (三)F检验 Z 检验、t 检验的平均数差异的显著性检验的前提假设是两个总体的方差是相同的,至少没有显著性差异。 对两个总体的方差是否有显著性所进行的检验称为方差齐性检验, 即必须进行 F检验。 1F分布 若从两个相互独立的正态总体中随机抽取两个独立样本, 以此为基础, 分别求出两个相应总体方差的估计值,这两个总体方差估计值称为 F比值,即 F=S12/S22。F比值的抽

57、样分布称为 F分布,F比值称为 F统计量。 2F检验(参见书 80 至 81 页) (四)x2检验(参见书 81 至 84 页) x2检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。 第四节 方差分析(略) 方差分析又叫变异数分析,它用于对多个平均数之间的差异进行检验。 F检验是对两个总体的方差所进行的差异检验, 而方差分析是对多个平均数之间的差异进行检验。 教育测量篇 第五章 教育测量概述 一、什么是教育测量 测:检测、观测;事物的内涵(弄清事物的本质) 量:衡量、度量;事物的外延(将事物数量化) 测量:检测与衡量,弄清事物的本质并将之数量化。 教育测

58、量:按照一定的规则对教育活动、教育现象等加以数量化测定的过程。 比如,测量一个学生思想品德如何,测量一个学生的学习兴趣如何。 二、教育测量有何特点 教育测量主要是对学生精神特性的测定,对精神特性的测定不同于对物理特性的测定。具体而言,教育测量具有以下特点: (一)教育测量具有间接性 精神特性:潜隐于身体内部,不能直接观察、度量。 不像物理特性的测量,可能通过直接观察和度量来达成,学生精神特性的测定,只能通过教育影响在学生行为上的表现以及学生对测试题的反应等, 并应用推理和判断的方法去间接测定这些行为属性。 (二)教育测量具有不确定性 精神特性:具有不稳定性和变化性 教育测量的不确定性是指教育测

59、量所使用的工具的单位具有相对性。 (三)教育测量服务于教育目标 教育测量既是检验教育教学成败的重要工具,又是改进教育工作,提高教育质量的保证。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们

60、按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 三、教育测量的要素 (一)参照点 参照点是计算事物数量的起点,又称零点,需点有绝对零点和相对零点之分。相对零点是人定的零点,教育测量中所使用的零点几乎都采用人定的相对零点。比如,智商。相对零点最大的限制是不能以倍数的方式解释分数。 (二)单位 任何测量都得有单位,如物理测量中的长度以单位米、分米、厘米等,重量单位千克等。教育测量也有单位如百分数、标准分数等。 (三)量表 量表是测量的工具,是参照点和单位的连续载体。如称是事物重

61、量的量表,尺子是事物长短的量表,又如教育测量中的智力量表、学习态度、学习能力量表等。 1称名量表 称名量表是用一定的数字对事特的类别加以标识,是与事特的分类相联系的量表。如用“1”表示男生,用“0”表示女生。 称名量表,只起到分类的作用。 2顺序量表 顺序量表是表示事物相对关系(如顺序关系)的数值特征量的量表。如学业成绩的第一名,第二名等,又如学生品德的优、良、中、差。 顺序量表既能分类,又能排序,但不具有等距性,不能进行运算。 3等距量表 等距量表最显著的特点是等距性,它对事物所作的数量划分是等距离的。等距量表具有等距性,但没有绝对零点。如,水的冰点(温度量表) 等距量表示的数值可以进行加减

62、运算,但不能进行乘除运算。 4比率量表 比率量表又称绝对量表,它既有相等的单位,即具有等距性,又有绝对零点,它是测量中最高水平的量表。如,重量,长度,身高、体重量表等。 比率量表中的数值可能进行加减乘除计算。 四、教育测量有何功能与作用 (一)在教学方面的反馈与激励功能 (二)在教育行政管理方面的评鉴与选拔功能 (三)在教育科研中的导向与信息提供功能 五、什么样的测量是好的测量(良好测量的特征) (一)信度(可靠性) 信度是指可靠性或可靠程度,测量的信度是测量结果反映被试真实水平和程度。 (二)效度(有效性) 效度是针对特定的目的而言,测量的效度是指测量出所要测量的特性的程度。 (三)难度(难

63、易性) 难度是就测验所含的项目(题目)而言,测验的难度是指项目(题目)的难易程度。 (四)区分度(鉴别性) 区分度也是就测验所含的项目(题目)而言,测验的区分度是指项目能区别不同水平的被试的程度。 区分度与难度是有关系的。一般而言,过高或过低的难度都晚使项目的区分度较低,项目要有良好的区分度,难度必须适中。区分度又影响到效度,若测验区分度较低会导致效度低。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为

64、教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 第六章 信度 第一节 信度的计算 对信度的估计或计算, 一般采用相关分析的方法, 即计算出两种变量的相关系数 (rxy) ,用相关系数的大小来表示一致性程度的高低。 一、再测信度 再测信度是用同一测验试卷, 在先后

65、两个不同时间对同一组被试施测后求得的实得分数的相关系数。再测信度是一种表示测验稳定性的方法,因此可用稳定性系数表示。计算再测信度实际上使用的是重测法。 测验 A1 适当时距 测验 A2 实质上,再测信度强调所测特质的稳定性,求得的稳定性系数本质上是考察跨时距上所得分数的一致性。因此,应注意以下几个问题: 首先,前后测验的时间间隔要适当。 其次,在两次施测的间隔期内,被试在所要测查的特质方面没有获得更多的学习和训练。 再次,再测信度适用于速度测验而不适用于难度测验。 二、复本信度 复本信度是一种表示测验等值性的方法,因此,复本信度可用等价值性系数表示。等值性系数是以两个等值但具体内容不同的量表,

66、 在最短时距内, 对相同被试先后施测两次测验所获得的两组对应分数的相关系。 测验 A1 最短时距 测验 B1 使用复本法计算等值性系数是为避免重测法的时间间隔对测验的影响,复本法十分强调两份测验的平行等值。因此,使用复本法计算等值性系数时,应注意: 1测验的同质性与等值性 2测验时距宜短 3测验的信度系数有稍微偏大的倾向 可以结合再测信度和复本信度,利用等值稳定性系数来判断测验信度。 测验 A1 适当时距 测验 B2 在使用等值稳定性系数时应注意: 其一,两个测试试题要具有较高的等值性 其二,两次测验的时距需要妥善规定 三、内部一致性系数 内部一致性系数是同一测验的各题项(例如分为奇数题和偶数

67、题)得分的相关系数 (一)分半系数 分半法是将一个测验分为两个假定相等而独立的部分来记分, 通常以奇数题为一组, 偶数题为另一组,不宜将前后两部分分组。分组之后,求两组分数的相关系数,最后用期皮尔曼-布朗公式校正,以求得整个测验的信度系数。 (二) 系数 主观性试题的评分,没有严格的评分标准,以致对同样一个题,被试得分各不相同。对于主观性试题的内部一致性系数,可以采用克龙巴赫创造的 系数公式来求。 计算内部一致性系数应注意: 1用分半法时,以按奇偶题分半为宜,不宜前后分半 2速度测验不宜用分半法 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整

68、合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 3客观性试题可以用分半法来计算信度,主观性试题宜用 系数公式计算测验信度

69、。 四、评分者信度 当测验是主观性试题, 且评分者有多人时, 不同评分者对同一分试卷评定的分数或等级常常不同,甚至有较大差异,这时需要考虑评分者之间的一致性问题。评分者信度即评分者评分的一致性系数。 若只有两人参评 N分试卷, 或一人先后两次评 N份试卷, 可用斯皮尔曼等级相关方法估计;若三个或三个以上的评分者评 N分试卷,则而计算肯德尔和谐系数以表示信度。 五、目标参照测验的信度(略) 六、速度测验的信度(略) 第二节 影响测验信度的因素 影响测验信度的因素很多,不过根本原因在于测量误差的影响。 一、系统误差 系统误差是由于量表有问题或评分标准掌握过宽或过严等原因导致测验结果有规律性的偏大或

70、偏小。 因而系统误差虽然会导致辞测量不准确, 但不影响测量结果的稳定性或可靠性,所以不影响测量信度。 二、随机误差 随机误差是由于各种偶然因素的影响而使测验产生的误差。 随机误差有可能在第一次测验中出现,而在第二次测验中不出现,这就影响了两次测验的一致性系数,从而影响随机误差。 三、抽样误差 抽样误差是由于测验中被试之间的差异造成的误差。 被试之间差异程度由标准差或方差来描述。而方差的大小正好反映测验的信度系数。 第三节 提高测验信度的方法 一、测验信度与测验长度的关系 测验长度增加,测验信度系数随之加大。 然而, 测验长度受到测验时间等因素的限制, 在实际应用中应在有限范围内尽可能地增加测验

71、的长度。 二、测验信度与测验难度的关系 测验太难或太易都会使信度降低。 应使测量的难度适当,经验表明测验的难度在 0.40-0.70 之间是合适的。 三、测验信度与测验项目的区分度的关系 项目区分度提高,测验信度系数相应提高。 提高项目区分度是提高测验信度的有效方法。 四、 测验信度与测验内容同质性的关系 测验内容同质性越高测验信度越高。 五、 测验信度与评分客观性关系 要尽可能客观地评分 六、 测验信度与测验程序统一性的关系 测验程序应前后统一 七、 测验信度与被试差异性的关系 被试差异性增大,信度系数也随之增大。 加大被试的差异,一方面可增大样本的容量,另一方面可坚持随机分层抽样。 育评价

72、将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇

73、学习必备 欢迎下载 第七章 效度 第一节 效度的估算 一、内容效度 内容效度是指测验内容与预定要测的内容之间的一致性程度。一致性程度高则效度高,一致性程度低则效度低。比如,要测验学生的学习能力,学习能力包括识记、理解、应用、分析、 综合以及评价等方面的能力, 检测内容效度就可以看测验内容是否反映了这些方面的能力。 二、构想效度 构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度。 构想效度主要适用于心理测验效度的确定。 所谓构想,是指心理学理论所涉及的抽象而属假设性的概念特质或变量,如智力,能力倾向、人格结构等。 三、效标关联效度 效标关联效度是指测验分数与作为效标的另一独立测验结

74、果之间的一致性程度。 一般是用本测验与效标测验去测同一组被试得到的两组分数的相关系数表示。 所谓效标,是检验测验效度的参照标准。 第二节 提高测验效度的方法 一、控制系统误差 二、精心编制量表 三、有效组织测验 四、扩大样本的容量 扩大样本的容量, 可以增加样本对总体的代表性, 增加代表性便可以抵消测验的随机误差,使测验更稳定可靠。 五、合理处理信度与效度的关系 测验效度要受测验信度限制,事实上效度的最大值受它的信度所制约。 信度是效度的必要条件,虽然信度高的测验效度不一定高,但效度高的测验,信度却一定比较高。 六、适当增加测验的长度 增加测验的长度,能提高测验的信度,从而使效度得到相应的提高

75、。因此,增加测验的长度, 既能提高测验信度也能提高测验效度。 不过测验长度对信度的影响大于其对效度的影响。 第八章 难度 第一节 难度的计算 一、客观性试题计算难度的方法 (一)原始定义法 当测验题目是采用二分法记分(即通过记 1 分,未通过记 0 分)时,可用公式 P=R/N计算项目的难度。 为平衡猜测对难度的影响,可用公式 CP= (KP-1 )/ (K-1 )校正 (二)极端分组法 极端分组法是根据测验总分按高低次序排列, 用两极端组在某项目上的平均通过率表示项目的难度。极端分给法计算项目难度的公式为:P=(PH+PL)/2 用极端分组法计算难度的步骤为: (1)按测验总分由高到低排序;

76、 (2)从高分段向下选出全部试卷的 27% 作为高分组; 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全

77、部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (3)从低分段向上选出全部试卷的 27% 作为低分组; (4)按公式 P=(PH+PL)/2 计算项目难度值。 二、主观性试题计算难度的方法 (一)平均分数法 主观性试题的难度可用公式 P= X/W来计算 (二)极端分组法 用极端分组法求主观性试题难度的公式为:P=(XH+XL-2NL )/2N(H-L) 基本步骤为: (1)按测验总分依次排序,确定比例各 25% 的高分组或低分组; (2)为高分组、低分组分别编制每题得分的分析表; (3)用以上难度公式计算难度值。 第二节 难度对测验的影响 一、难度对测验分数

78、分布的影响 测验项目的难度值越小,测验项目的难度就越大,正确回答试题的人数就越少,测验分数就越集中在低分端,其分数分布越呈正偏态分布;项目的难度值越大,难度就越小,正确回答试题的人数就越多,测验分数就越集中在高分端,其分数分布越呈负偏态分布。 二、难度对测验鉴别力的影响 测验的主要功能之一是鉴别学生水平的高低, 适宜的难度可以加大考生得分的差异, 从而提高测验的鉴别力。项目难度值为 0.5 左右时,测验得分的方差才可达最大值,而方差越大,测验的鉴别力越强。 三、难度与测验目的的关系 项目难度应根据测验目的来确定,不能认为任何测验项目的难度值等于 0.50 最好。一方面,如果每个项目的难度值都等

79、于 0.50, 会使测验分数的分布呈又峰状态,即 50% 的人所有题目全部答对,得满分,50% 的人所有题目全部答错,得零分。所以,最好使测验题的平平均难度接近 0.50 ,即在 0.50 加减 0.20 之间,而不要求每个试题的难度值都等于 0.50 ;另一方面,项目难度不能一概而论,应由测验目的的需要来确定,如果测验的目的在于选拔人,则应采用难度值接近录取率的项目,如果要录用 10% 的应聘者,则适宜难度应为 0.10,又如要高考要录取 80% 的高生,则适宜难度为 0.80 。 第九章 区分度 区分度是测验对考生实际水平的区分程度 第一节 区分度对测验的影响 区分度通常用 D表示。D的取

80、值范围在-1.00 和+1.00 之间,D值越大,试题的区分能力越强。当 D为正值时,说明试题是积极区分,即高分组通过率高,低分组通过率低。D为负值时,说明试题是消极区分,高分组通过率低,低分组通过率高。D为 0 时,说明试题无区分作用。 一、区分度与难度的关系 区分度与难度有着直接关系, 在一定程度上说, 难度决定了区分度。 试题难度过大过小,其区分度都较低。当难度值为 1.00 或 0 时,高分组和低分给或全部得满分,或全部得零分,这时区分度都为 0。 调整难度是提高区分度的重要方法。虽然试题难度为 0.50 时区分度达到最大值,但并不需要所有试题的难度都为 0.50, 最好是各题难度在

81、0.50 加减 0.20 之间, 平均难度接近两0.50 为最佳。 二、区分度与信度关系 测验中各试题的区分度 D值的平均数越大,测验的信度就越高。同时,试题的区分度是育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知

82、识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 测验是否具有效度的指示器。 项目区分度应根据测验目的而的,若测验是为了选拔人员,区分度要求较高,若测验只是考查学生对知识的掌握情况,可不过多考虑区分度。 第二节 区分度的计算 一、极端分组法 极端分组法仍然是依照前面的方法将测验总分排序,确定一定比例的高分组与低分组,然后根据高分组和低分组在某项目通过率上的差异比率,最后确定其区分度指标。 (一)客观性试题区分度的计算 计算公式为:D=PH-PL 计算步

83、骤为: (1)按测验总分由高到低排序 (2)确定测验总分最高的 27% 的被试为高分组,最低的 27% 为被试低分组 (3)分别求出这两给被试通过试题的百分比 (4)将算得的有关数据代入计算公式 (二)主观性试题区分度的计算 计算公式为:D= (XH-XL)/N(H-L ) 计算步骤为: (1)按测验总分由高到低排序 (2)确定测验总分最高的 25% 的被试为高分组,最低的 2% 为被试低分组 (3)列出试题分析表 (4)将有关数据代入区分度计算公式 二、相关法 用极端分组法求项目区分度, 只使用了高分组和低分组的数据, 中间还有部分数据没有参加计算, 因而所得结果不够准确。 为避免这一不足,

84、 可采用相关法分析项目的内部一致性,即以项目分数与效标分数(效标分数不易得到时,则以测验总分代替)的相关作为项目区分度的指标,相关越高,区分能力越强。 (一)积差相关 当考生在试题上的得分与测验总分都属于连续变量时, 可以采用积差相关法计算试题的区分度。 (二)点二列相关 当测验的一个变量为连续变量, 另一个变量为真正的二分变量时, 要用点二列相关系数表示项目的区分度。 (三)二列相关法 当测验总分和项目分数均为连续变量, 而其中一个被人为分为两个类别, 欲研究它们之间的关系就要用二列相关法。 (四)相关法 当测验的两个变量都是二分变量时,可用相关系数来表示某项目的区分度。 (五)项目效度分析

85、法 前面四种相关法都用内部一致性计算区分度, 测验项目效度分析是要了解被试对某一试题的反应与外在效标之间的关系。 具体采用什么分析法计算项目区分度, 应根据测验的特质和种类来决定。 如果该测验所要测的是单一特质,即测验量表由同质性题目所组成,宜采用内部一致性分析方法,如果测验是用来测量多种不同特质的, 用来考验效度的效标也是多种特质的组合, 则适用项目效度分析法。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量

86、侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 第十章 教育测验的编制与实施 第一节 编制测验的一般原则 一、目的性原则 二、典型性原则 三、灵活性原则 四、科学性原则 第二节 编制测验的一般步骤 一、确定测验目的 二、分析教育目标 教育目标的分析一般以

87、布卢姆等建立的教育目标分类学为依据。 双向细目表就是编制测验的蓝图。 编拟测验双向细目表的一般步骤为: (1)按照各级教学目标的试题在整份试卷中的一般比例和学生的实际水平进行横向设计。 (2)根据知识内容的重要性和综合性程度进行纵向设计。 (3)根据纵横双向比例把实际得分点分配到中间每个格子中去,这样就制成了测验的双向细目表。 三、测验取材并编拟题目 (一)测验取材要有目的性 (二)测验取材要有代表性 (三)测验取材要有普遍性 (四)测验取材要有鉴别性 四、试测与分析 五、编制测验 第三节 测验的编辑与实施 一、测验的编辑 (一)试题的检查 (二)试题的编排 1将测验认知目标相同的试题编排在一

88、起。 2应将同一类型的试题编排在一起。 3应由易到难排列试题。 (三)编写答题说明 答题说明一般包括以下内容: 1 测验的目的 2 测验的时间限制 3 回答试题的方法 4 记分的方法 二、测验的实施 (一)测验前的组织工作 印制试卷时,一般可采用两种形式:其一是分离式试卷,基二是传统的综合式试卷。 试卷应注意以下事项: 1 不同类型的试题之间,应留出两行间隔,以达到使考生易读的效果; 2 多重选择题的题干与选项不能印在同一行中,每个选项应单独占一行; 3 一道试题不能分开印在两页上,以避免考生来回翻阅试卷,耽误时间,分散精加,育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三

89、门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 发生错误; 4 试卷上的试题作答空间应该够

90、用; 5 试卷应统一规格印制,并力求美观、经济与实用。 (二)测验的施行 (三)试卷的评定 教育评价篇 第十三章 教育评价概述 一、什么是评价 评价:公平地说人或事物的价值,对人或事物的价值进行判断。 二、教育评价活动的范畴 任何一项教育评价工作,必须首先要解决这样几个问题:为什么评价,评价谁,谁来评价,用什么依据来评价,评价什么,如何评价。明确了这几大问题,教育评价才能科学、有效地实施。 (一)为什么评,即教育评价的目的 教育评价目的服务于教育目的,改进、优化教育活动。 (二)评价谁,即教育评价的对象(也称教育评价的客体) (三)谁来评价,即教育评价的评价者(也称教育评价的主体) (四)用什

91、么依据来评价,即教育评价的标准 (五)评价什么,即教育评价的内容 (六)如何评,即教育评价的模式、方法、过程等内容 三、现代教育评价发展趋势及特点 (一)评价功能从侧重鉴定走向侧重发展 (二)评价范围由片面转为全面 (三)评价主体由一元走向多元 (四)评价过程从封闭走向开放 (五)评价方法由单一的定量发展为定量、定性相结合 四、教育评价的功能与作用 (一)导向功能 (二)鉴定功能 (三)激励功能 (四)改进功能 五、教育评价的类型 (一)按评价目的分类 1诊断性评价 诊断性评价(diagnostic evaluation)又称为事前评价或准备性评价,它是指在某项活动开始之前,对评价对象的现实状

92、况、所存问题及问题产生的原因作出的评价。布卢姆认为,诊断性评价就是在学期、学习单元的教学活动开始之前所实施的评价,其目的主要是了解学生是否具备接受新的学习任务所必需的基础知识、 技能和能力; 是为了制订课时教学计划而进行的评价。 2形成性评价 形成性评价(formative evaluation)是通过诊断教育方案或计划、教育过程与活动中存在的问题, 为正在进行的教育活动提供反馈信息, 以提高实践中正在进行的教育活动的质量的评价。 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中

93、的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 3终结性评价 终结性评价(summative evaluation)是指对评价对象在一定时期内的比较全面的状况所进行的评价。 (二)按评价

94、的参照标准分类 1相对评价 相对评价是指在评价对象群体中选取参照标准, 以确定评价对象在群体中的相对位置或与群体中某一个体之间的差距的评价。相对评价的参照标准,一般是该群体的常模,因此,相对评价也被称作常模参照评价。 2绝对评价 绝对评价是指在评价对象的集合外选取某一参照标准,将评价对象与这个标准进行比较, 判断其达到客观标准程度的评价。 绝对评价关心的是评价对象是否达到了既定的参照标准及其达到程度,因此也称为目标参照评价。 3个体内差异评价 个体内差异评价是把评价对象集合中各元素的过去和现在相比较, 或者对一个元素的若干侧面相互比较。 (三)按评价主体分类 1自我评价 自我评价又称内部评价,

95、 是指被评价者依据评价原理对照一定的评价标准对自身进行的价值判断。自我评价的主体可以是个人、团体与组织,如学生的自评、教师的自评、学校的自评等等。 2他人评价 他人评价又称外部评价, 是指被评价者以外的人按照一定标准对被评价者进行的价值判断,如社会评价、领导评价、同行评价、专家评价、行政评价等等。 (四)按评价方法分类 1定量评价 定量评价是指在评价过程中运用数学方法去处理、 分析信息, 取得数量化评价结果的一种评价。 2定性评价 定性评价是指在评价过程中采用非数量化的方式, 对事物发展过程和结果采用观察和质性分析的方法进行描述、分析和评价,作出定性的评价结论。 第十四章 教育评价指标体系 第

96、一节 教育评价指标体系概述 一、教育评价指标体系的内涵 (一)评价指标 (二)指标权重 (三)评价标准 二、制定教育评价指标体系的依据 (一)教育方针、政策和法规 (二)教育评价目标 (三)教育规律 (四)教育实际 三、制定教育评价指标体系的原则 (一)时代性与导向性原则 (二)科学性和可靠性原则 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数

97、据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (三)有效性与可行性原则 (四)完备性与独立性原则 第二节 教育评价指标体系设计 一、拟定评价指标 (一)初拟指标 1头脑风暴法 2因素分解法 (二)筛选指标 1经验法 2调查统计法 二、分配指标权重 1专家会议法 2特尔斐法 3层次分析法 4两两比较法 三、制定评价标准

98、(一)分解末级指标,形成评价要点 (二)确定等级数量 (三)确定标号和标度 第十五章 教育评价内容 第一节 学校评价 一、学校评价观 二、学校评价内容 三、学校评价实施 方向定位系统,产品输入系统,资源条件系统,组织管理系统,过程监控系统,产品输出系统,评价反馈系统。 第二节 教师评价 一、教师评价观 二、教师评价内容 三、教师评价实施 上课、说课、听课 第三节 学生评价 一、学生评价观 二、学生评价内容 三、学生评价实施 发展性评价 第十六章 教育评价模式 教育评价模式是教育研究工作者依据某种教育理念、教育思想或特定的教育评价目的,选取一种或几种评价途径所建立起来的相对完整的评价体系。 第一

99、节 目标模式 一、目标模式的提出 二、目标模式的基本内容 (一)确定教育目标 (二)设计评价情境 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概

100、述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 (三)选择和编制评价工具 (四)分析评价结果 目标模式可以进一步具体化为以下几个步骤: (1)确定教育目标; (2)根据行为和内容来界说每一个目标; (3)确定应用目标的情景; (4)设计呈现情景的方式; (5)设计取得记录的方式; (6)决定评定时使用的记分单位; (7)决定获取代表性样本的手段。 三、目标模式的优缺点 目标模式的优点是: (1)在泰勒主张“用教育评价来代替测验”的概念下,运用目标分类理论,不仅考察学生对知识的回忆,还考察了理解、应用、综合等复杂的目标。

101、并且在评价方法上也不只限于纸笔测验, 只要是关于行为目标是否达成的有效证据, 都可以看成是评价的有效方法。目标模式涉及观察法、访谈法以及对学生作业和练习的评估等方法。 (2)注重目标和注重目标分类,并用行为术语表达目标,评价目标的标准简洁明了。 (3)通过对学生行为的考察确定达到目标的程度, 通过反馈信息, 促进教育活动能够尽可能地逼近教育目标。 (4)操作性强,容易见效,且比较经济。 目标模式也有很多不足,主要有: (1)评价以目标为中心和依据,评价目标来源于课程目标、 教育计划等, 忽视对目标本身合理性的判断。 (2) 针对学生的特定行为结果进行判断,有些行为结果被排除在评价之外,因此容易

102、造成教育评价内容不全面。 (3)教育目标需作行为化表述, 可是有的教育目标不易用行为语言恰当表述, 像人类情感和意识等因其本身的复杂性,用行为目标来表述难免有简单化之嫌。 (4)对学生行为结果作评价,重视结果评价,忽视了过程评价。 (5)用统一的目标模式评价每一个人,忽略了人的个性化特征。 四、目标模式的运用 第二节 CIPP 模式 CIPP模 式 是 用 四 种 评 价 方 式 的 第 一 个 英 文 字 母 命 名 的 , 即 背 景 评 价(Context-evaluation) 、输入评价(Input-evaluation)、过程评价(Process-evaluation)和结果评价(

103、Product-evaluation)。 一、CIPP 模式的提出 二、CIPP 模式的基本内容 (一)背景评价(Context) (二)输入评价(Input) (三)过程评价(Process) (四)成果评价(Product) 三、CIPP 模式的优缺点 CIPP 评价模式的优点是: (1)根据现实需要和社会需要,考虑了评价目标的选定及其合理性问题,使目标更符合社会需要,符合实际。克服了目标评价模式的不足。 (2)评价贯穿教育活动的始终,使评价成为改进工作,提高教育质量的工具。 (3)评价的内容广泛,从对教育需要的调查开始,包括需要、问题、目标、条件、计划、实施、结果以及结果的影响等教育过程

104、的所有阶段。对教育过程不同阶段、不同方面的评价,评价发挥着不同的功能,对上述全部内容的评价也就把评价的诊断性、形成性、终结性三种功能充分地展露出来。 CIPP 模式也同样存在一些缺陷: (1)无论是背景评价、输入评价、过程评价和结果评价都在为决策者服务, 对过程的评价主要是为了确保活动结果达到预期目标, 一切活动围绕育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育

105、统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 目标开展, 一定程度上限制了活动参与者的创造性发挥。(2) 该模式要求各类信息源的配合、充裕的经费以及专业的分析方法,其使用受到了一定的限制。 四、CIPP 模式运用 第三节 目标游离模式 一、目标游离模式的提出 二、目标游离模式的基本内容 斯克里文认为,

106、对目标的考虑和评价是一个不必要的,而且很可能是有害的步骤。目标评价很容易使评价人受方案制定者所确定的目标的限制, 严格地按目标办事也容易限制评价的范围。同时,目标评价使得教育活动只围绕预定目标开展,损害了教育活动的深远意义。因此,目标游离模式把评价的重点由“方案想干什么”转移到“方案实际干了什么”上来。 目标游离模式的评价者在不知道预定目标的情况下, 全面的收集关于方案实际结果的各种信息,不管这些结果是预期的还是非预期的,也不管这些结果是积极的还是消极的,这样才能作出正确全面的判断。 此模式与前面提及的目标评价模式和 CIPP 评价模式不同,它没有完整的评价程序。但提出了需要把握的要点,它们是

107、: 1评价者在不受方案目标干扰的情况下,直接搜集关于方案实际结果的各种信息。这样,才能保证信息收集的客观性与全面性。 2根据教育的内在价值,分析收集到的信息,对方案的效果进行评价。 它从检查方案的结果来判断其价值,而不考虑目的或目标,不受预定目标的影响。目标游离模式能在较大程度上避免主观偏见, 尽可能地对方案的实际效果作出公允、 全面的评价,很好地考察了教育活动满足实际需要的程度。 三、目标游离模式的优缺点 目标游离评价模式的优点是: (1)突破了目标的限制。目标游离模式认为评价中最为重要的准则并非是方案应当满足其目的的程度, 而是方案在实行后取得的效果及满足需要的程度,是一种在全面收集方案实

108、际结果的各种信息后作出的判断,是一种“以需要为基础的评价” 。 (2)它强调评价相对于教育目标的独立性,强调对所有结果考察的重要性,强调对评定目标进行价值判断的必要性,重视目标效应以外的非预期效应。 “非预期效应”概念的提出具有很大的现实意义,它拓展了评价的视野,对后来评价的发展产生了重要的影响。 目标游离模式的不足之处在于: (1)因为不考虑预定的评价目标,有简单地用评价者的目的替代了方案管理者的目的可能性,评价者在评价时缺少了评判的准则。 (2)它没有完整的定义,没有组织结构的详细说明,没有采集数据的具体方式和信息发布体制,没有一套完整的程序,因此算不上一种完善的评价模式,实际操作起来有一

109、定难度。 四、目标游离模式的运用 第四节 应答模式 一、应答模式的提出 二、应答模式的基本内容 斯太克认为,评价一个方案可以有不同的方法,没有哪一个方法是绝对正确的。要使评价真正产生效用, 其核心是评价应该向听取评价结果的人提供他们所关心的信息, 评价者应该充分了解他们所关注的问题、兴趣和焦点。他指出评价可以做到: (1)牺牲某些测量上的准确性以换取对评价听取人的有用性; (2)更关心方案的活动而不是方案的意图; (3)更注意反映与方案有关的各方面人的意志而不仅仅是一部分人的意志。因此,斯太克认为,应答模式的评价理念可以表述为,不同的人有不同的价值观,因此在判断同一件事物时,不同育评价将教育统

110、计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备

111、 欢迎下载 的人会选取事物的不同方面作出判断, 并具有不同的价值判断标准, 只有各方共同参与才能使评价结果尽可能公正、客观。 关于应答性评价模式的操作,斯太克用了一个类似于时钟的图形加以表示,命名为“评价时钟”。但是要注意的是,时钟所标出的顺序并不是不可改变的,在实际的评价中,操作的顺序要视委托人的需求和问题而定。可以顺时针进行,也可以逆时针进行,还可以是跳跃式地进行。评价活动可以通过 12 个事件进行组织,这 12 个事件分别是: 12 时: 方案的评价者与方案的委托人、方案的执行人进行交谈。 1 时:识别方案的范围。 2 时:对方案的设计作通盘考虑,概览整个评价活动。 3 时:找出评价的真

112、正目的和评价的重点。 4 时:找出评价的关键性问题,给以明确表述,为确定搜集哪些资料做准备。 5 时:确认什么样的资料是真正需要的和重要的。 6 时:规划搜集资料的活动,包括拟定观察计划、确定观察者和观察工具、选择样本、确定对资料进行审查的人员等。 7 时:观察并讨论先在因素、实施因素及结果因素,探讨计划的理论基础等。 8 时:分析所得资料,进行理论总结,准备描述性材料,开展个案研究。 9 时:通过有关各方人员对分析描述结果作出的反应,检验所得资料及作出的分析是否有效,即是否达到为委托人提供服务的目的。 10 时:对各方人员的反应进行筛选,并加以适当的组合;报告组合的结果,使各方人员都能了解这

113、一结果,以使评价产生最大的效用。 11 时:根据委托人的需要,准备正式的资料报告或者展示报告。报告的形式视情况而定,如原始的观察资料、访谈录音、文字总结等。 三、应答模式的优缺点 应答模式的优点是: (1)强调价值观的多元性和发散性。坚持价值存异观点,充分尊重所有人的需要,承认价值多元化,用不同的价值观分析问题,反应成败的原因。(2)在方法上,强调了非正式的观察、交往,描述性的定性分析方法。但也不否定测验,促进了定量与定性的结合。(3)评价过程具有动态性。提倡一种自然主义的、动态的评价运作方式,评价程序不是刻板的,在评价过程中评价者与其他参与者反复沟通,及时反馈,评价的计划随时调整,评价的程序

114、更为灵活。(4)被评价者得到了充分的尊重和信任,他们的需要和评价意见融合进评价报告中。该模式反映了与被评者有关的各方面人员的需要。 应答评价模式的不足表现为,在实施过程中要耗费大量的人力、物力、财力。 四、 应答模式的运用 第十七章 教育评价方法 第一节 搜集教育评价信息的常用方法 一、观察法 二、问卷调查法 三、访谈法 四、文献法 五、表现性测验法 六、档案袋评价法 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育

115、测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇学习必备 欢迎下载 第二节 处理教育评价信息的常用方法 一、统计分析方法 二、模糊综合评判法 第十八章 教育评价过程 第一节 教育评价过程概述 一、教育评价过程的含义 二、教育评价过程的特点 第二节 教育评价的过程 一、准

116、备阶段 二、实施阶段 三、总结阶段 育评价将教育统计教育测量与教育评价联系起来进行研究与探讨这不仅符合三门学科之间的逻辑关系更有利于整合三门学科的优势充分发挥它们在教育管理教育教学实践教育研究等领域中的作用无论是从教育管理教育教学实践的层息的必要手段和有力工具教育测量侧重于为教育评价提供反映事物本质状态的原始数据教育统计着力于对这些数据进行整理分析述与推断从而提供反映事物本质状态的统计数据依据这些统计数据教育评价才能作出科学客观准确的价识则是测量的前提而掌据测量知识又是评价的前提所以我们按统计测量评价的顺序来开展教学教育统计第一章概述一统计学概述一何为统计统汇总起来总括全部计计算统计将数据汇总起来加以计算即对某一现象有关的数据的搜集汇

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号