教育统计与测量

上传人:cn****1 文档编号:570171850 上传时间:2024-08-02 格式:PPT 页数:402 大小:4.27MB
返回 下载 相关 举报
教育统计与测量_第1页
第1页 / 共402页
教育统计与测量_第2页
第2页 / 共402页
教育统计与测量_第3页
第3页 / 共402页
教育统计与测量_第4页
第4页 / 共402页
教育统计与测量_第5页
第5页 / 共402页
点击查看更多>>
资源描述

《教育统计与测量》由会员分享,可在线阅读,更多相关《教育统计与测量(402页珍藏版)》请在金锄头文库上搜索。

1、刘经兰刘经兰赣南师范学院教育科学学院赣南师范学院教育科学学院(学前教育1101、1102)三教407周二1、2节,周五双1、2节n教育统计与测量是一门应用性的学科,学习的过程也是应用的过程,从而提高本门课程的学习效果,更好实现课程的功能。n准备的学习用具:统计功能的计算器,练习本两本 教育统计篇教育测量篇教育统计篇教育统计篇n第一讲第一讲教育统计绪论教育统计绪论第一节第一节教育统计学概述教育统计学概述研究对象研究对象研究方法研究方法研究内容研究内容研究对象研究对象教育统计学:应用数理统计学的原理和方法研究教育问题。主要研究如何收集、整理、分析由教育调查和教育实验所获得的数据资料,并以此为依据进

2、行科学推断,揭示教育现象所蕴涵的客观规律。研究方法n研究过程(三阶段)资料的收集资料的整理资料的分析研究方法调查实验实验全面调查重点调查典型调查抽样调查单组实验单组实验等组实验等组实验轮组实验轮组实验一组对象,若干处理相同条件对象,不同处理一组或多组对象,轮换处理抽样调查n单纯随机抽样从调查总体中完全随机地抽取调查单位或个人。n分层抽样将总体中每一个个体按照一定的规则分为不同的类型或层次,然后从各层次中按一定规则随机抽取若干样本。n整群抽样是抽取的对象以整群为单位而不是以个体不单位的抽样方法n机械抽样P4随机数的产生随机数的产生n大小为N的总体中产生样本量为n的随机样本的一个常用的方法是利用随

3、机数(random number)。 n利用随机数步骤为:(1) 把总体的所有个体编号;(2) 产生n个在0到N之间的随机数;(3)与如此产生的随机数中的数目相同的个体则形成了样本量为n的简单随机样本。n最原始的办法是掷一种正20面体的均匀材料制成的骰子,标有两套0到9的数字。每次产生一个0到9的数字。n另一种是查阅随机数表。在一些传统的统计教科书后可以找到随机数表;也有专门的随机数表的册子。n今天,多用计算机产生的伪随机数(pseudo-random number)来代替真正的随机数。研究内容n描述统计统计图表统计特征量n推断统计正态分布总体均数的估计假设检验方差分析n描述统计研究如何对客观

4、现象的数量特征进行计量、观察、概括和表述。n用表和图表示,计算特征量(如平均值)等,所论不超出已有数据。n推断统计(统计推断)据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有错误、误差,用概率论的术语和方法来描述和论证。误差的产生源于数据有误差。怎样尽可能减少推断的错误和误差,是统计推断的中心问题。描述统计与推断统计描述统计与推断统计n目的描述数据特征找出数据的基本规律n内容确定要研究的数量特征设计统计指标(说明这些数量特征的)搜集数据整理数据计算并显示指标数据描述统计0 0 0252525505050Q1Q1Q1 Q2Q2Q2 Q3Q3Q3 Q4Q4Q4x x x =30=3

5、0=30s s s2 22=105=105=105描述统计的主要方法描描描描述述述述统统统统计计计计方方方方法法法法集中量数集中量数: : 描述集中趋势描述集中趋势差异量数差异量数: : 描述离散程度描述离散程度相关系数相关系数: : 描述关系程度描述关系程度偏态系数偏态系数峰态系数峰态系数特征值特征值特征值特征值单向次数分布表单向次数分布表单向次数分布表单向次数分布表双向次数分布表双向次数分布表双向次数分布表双向次数分布表列联表列联表列联表列联表( ( ( (交叉表交叉表交叉表交叉表) ) ) )统计图统计图统计图统计图次数分布图次数分布图,如如直方图直方图发展趋势折线图发展趋势折线图相关散

6、点图相关散点图描述数据的正态程度n目的:目的:对总体特征作出推断。n内容:内容:样样本本总总体体推断统计推推推推断断断断统统统统计计计计参数估计参数估计参数估计参数估计假设检验假设检验假设检验假设检验点点点点估计估计估计估计区间估计区间估计区间估计区间估计均数差异显著性检验均数差异显著性检验次数分布差异显著性检验次数分布差异显著性检验比例数差异显著性检验比例数差异显著性检验变量间关系显著性检验变量间关系显著性检验描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据总体内在的数总体内在的数总体内在的数总体内在的数量规律性量规律性量规律性量规律性推断统计

7、推断统计(利用样本信息对(利用样本信息对总体的数量特征进总体的数量特征进行估计和检验等)行估计和检验等)概率论概率论(包括分布理论、大数(包括分布理论、大数定律和中心极限定理等)定律和中心极限定理等)描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据图图图图1-11-1统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程第二节教育统计学的初步概念n被试n数据与变量n随机n误差n抽样与样本n定性研究和定量研究n统计量与参数n(一) 随机变量n(二)总体、样

8、本和个体n(三)次数、频率和概率n(四)误差n(五) 统计量与参数n(六)定性研究与定量研究(一) 随机变量随机变量n1、在相同条件下进行的实验或观察,其可能结果不止一个,事先无法确定,这类现象称为随机现象。具备以下三个条件:n第一,一次试验有多种可能结果,其所有可能结果是已知的;n第二,试验之前不能预料哪一种结果会出现;n第三,在相同的条件可以重复试验。n2、随机现象的每一种结果叫做一个随机事件。n3、我们把能表示随机现象各种结果的变量称为随机变量。用X、Y、X1、X24、随机变量的分类:n实验数据按由什么观测方法得来,可划分为两大类,n一类是计数数据计数数据,是指计算个数的数据,一般属性的

9、调查获得的是此类数据,它具有独立的分类单位,如人口数、学校数等等,一般都取整数的形式。n另一类测量数据测量数据,是借助于一定的测量工具或一定的测量标准而获得的,如身高、体重、分数、各种感觉阈等等。 4、随机变量的分类:n测量数据按其是否等距和有无绝对零点,又可细分为下述四种测量水平:(1)有相等单位又有绝对零点的数据称为比率变量,如身高、体重、反应时、各种感觉阈值的物理量。(2)有相等单位但无绝对零点的数据,称为等距变量,如温度、各种能力分数、智商等。(3)既无相等单位,也无绝对零点,仅表示顺序,不能指出其间的差别大小的数据,称为顺序变量。如等级评定、品质等级等等。(4)既无相等单位,也无绝对

10、零点,仅表示其名称的变量,称为称名变量。如名字、学号等等。4、随机变量的分类:n测量数据按其是否具有连续性可划分为n连续变量与离散变量(二)总体、样本和个体n总体是指具有某种特征的一类事物的全体又称母体。构成总体的每个基本单元称为个体。从总体中抽取一部分个体,称为总体的一个样本。 样样本本总总体体(三)次数、频率和概率n1、次数 次数是指某一事件在某一类别中出现的数目,又称为频数,一般用符号f表示。n2、频率 又称相对次数,即某一事件的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据数目的总数除。频率常用比例来表达,有时也用百分数表示。f/Nn3、概率又称机率或然率,常用符号P表示。是

11、指某事件在无限的观测中所能预料的相对出现的次数。概率常用比例表示。 (四)误差n测定的观测值与真值之差称为误差.误差可分为随机误差、系统误差和抽样误差三种类别。n随机误差指由与研究目的无关的难以控制的偶然因素所引起的误差。n系统误差指由与研究目的无关的因素所引起的有规律性的误差。n抽样误差指由于抽样而产生的误差。抽样误差属于随机误差的范畴,由于它在统计中的重要地位,所以人们专门列条陈述。(五)(五) 统计量与参数统计量与参数n统计量又称统计特征数,是根据科研实验所获得的一组观测值计算出来的一些量数,又称为样本统计量。n参数又称总体参数,是指描述一个总体情况的一些统计指标。n统计量和参数所用的名

12、称基本相同,但符号是不一样的。 (六)定性研究与定量研究n定性研究是对教育的研究内容进行质的分析,通过分类选取典型例证的方式对信息重新组织和在描述性的基础上得出结论。n定量研究是指对教育中所包含的信息采用一定的方法、技术进行量的分析。思考与练习题n1、何谓教育统计学?学习它有何意义?n2、什么是随机变量?教育科学实验所获得的数据是否属于随机变量?n3、怎样理解总体、样本与个体?n4、何谓次数、频率及概率?n5、统计量与参数之间有何区别和关系?6、下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?称名变量,顺序变量,等级变量,比率变量n(1)17.0千克 (2)89.85厘米n (3

13、)199.2秒 (4)17人n (5)25本 (6)93.5分n(6)35号 (7)第一名,第二名n(8)3第二讲描述统计n第一节第一节 统计表与统计图统计表与统计图n第二节第二节 教育统计的特征量教育统计的特征量第一节 统计表与统计图n统计表n构成:统计表一般由标题、表号、标目、表注等构成。横标目的总标目(亦可空白)纵标目(一般设谓语)横标目数字表的标题?注脚:说明资料来源等XXX(顶线)(底线)统计表基本格式编制统计表的要求n()表的结构要简单明了,层次清楚。n ()表的标题要简明扼要地、确切地反映表的内容,写在表的上端的中央位置。n ()表的标目有横、纵标目之分。 一般将统计表所要叙述的

14、主要对象放在横标目n上,而将用以叙述的统计指标在纵标目上。n ()表内数据排列要整齐,小数点位置要对齐,缺数据格或无数据格要划斜线。n ()表的标题、标目或数字有未尽之意的地方,应加脚注说明,表中资料的来源应在底线下加以注明。简单表表2 重庆2中各年高考录取人数年份1993 19941995 1996 1997 合计高考录取人数101109110150190560复合表表2。4某高级中学各年级文理科男女学生人数科别文科理科总计男女男女男女高一12085180110305195高二11090170105280195高三14011019095340205总计3702855453109155954、

15、频数分布表n对于一组大小不同的数据划出等距的分组区间称为组距(i),然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表式。这种统计表又称之为次数分布表。 编制次数分布表的步骤n(1)求全距。全距指最大数与最小数之间的差距。 n(2)决定组数与组距。组距是指每一组的间距,用符号i表示 n(3)列出分组区间。分组区间又称为分组阶段。n列分组区间要注意以下几点:最高组区间内应能包含最大值的数据,最低组区间应能含最小值的数据。最高组或最低组的下限最好是组距的整数倍。分组区间可写为10一,20一,30一,40一等,但我们l必须明确,实际上各组的精确界限应是9.5一19.499。 n(4

16、)登记次数。依次将数据登记到各个相应的组别内,一般用划线记数或写正字的方法。n(5)计算次数(f)。各组的次数计算好后,还要计算总和即总次数。一是为了以后计算的需要,二是为了核对各组总和与数据总数(N)是否相等。n(5)抄录新表。登记核实后,重新制表。5.累积频数分布表及累积百分比分布表 表一表一 三(三(2 2)班)班3030名学生语文、数学、英语期末考试成绩名学生语文、数学、英语期末考试成绩 (三科成绩均服从正态分布)学号语数英学号语数英学号语数英018793851180727621676571026567741276818222807883037372801366707323848795

17、049486821453576024867775058078761544525325616264067875651649504526687274077580761774818027726966086360581869707328788688095866671973747229828178107074742052435430767585表二:三(2)班30名学生语文成绩频数分布表分组区间组中值xc简单频数f相对次数f/N%累积频数FbFa累积百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.33

18、50-5531052893.3340-4526.67230100x30n课堂练习:n三(2)班30名学生英语成绩频数分布表n利用计算机制表常用的计算机软件:Excel,SPSS制表n用Excel软件制表语文语文数学数学英语英语物理物理化学化学政治政治体育体育高三(1)75698976798384高三(2)82659065778976高三(3)72888789856789高三(4)67817981896963二、统计图n(一)统计图的功用(一)统计图的功用n所谓统计图就是依据数字资料,应用点、线、面、体、色彩导的描绘制成整齐而又规律,简明而又知其数量的图形。统计图一般采用直角坐标系,横坐标用来表

19、示事物的组别或自变量X,纵坐标常用来表示事物出现的次数或因变量Y.(二)统计图的结构与制图要点(二)统计图的结构与制图要点n图号及图题 n图目n图形图形 n图注图注(三)统计图的种类(三)统计图的种类n统计图可按形状、数字性质、图的用途等标志分为多种类别。教育统计中常用的统计图可按形状划分为直条图、直方图、曲线图、圆形图、散点图等等。n统计图:由标题、图号标目、图注等项构成。单式条形图第一节统计表与统计图n复式条形图圆形图(饼图)圆形图(饼图)折线图4.线条图5.频数颁布直方图图.4中考化学统计成绩直方图6.累积频数图图.52004年中考化学抽样得分情况累积频数图102030405060708

20、090100图2.6:高一语文7、面积图面积图n三(2)班30名学生语文成绩简单直方图、折线图、累积次数直方图、累积次数曲线表二:三(2)班30名学生语文成绩频数分布表分组区间组中值xc简单频数f相对次数f/N%累积频数FbFa累积百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100x30n课堂练习:n三(2)班数学和英语成绩的次数分布表.相对次数分布表,累积次数分布表和次数直方图,次数多边图和累积次数曲线.n利用计算机制图常用

21、的计算机软件:Excel,SPSS制图n用Excel软件制图第二节教育统计的特征量n最常用的统计量有三类:n一类是代表一组数据典型水平或集中趋势的量,即集中量;n另一类是反映一组数据的变异程度或离散程度的量,即差异量n第三类是反映数据的相关程度的量,即相关量。一、集中量n定义:代表一组数据典型水平或集中趋势的量。平均数n算术平均数原始数据法:频数分布表法n加权平均数原始数据法频数分布表法n集中量是代表一组数据典型水平或集中趋势的量。n常用的集中量有平均数、中位数和众数。一、平均数n1、算术平均数n2、加权平均数n1、算术平均数n简称为平均数或均数(Mean)。1、算术平均数n(1)未分组数据平

22、均数的计算方法n(2)数据分组后计算平均数的方法n(3)平均数特点n(4)平均数的意义与应用(1)未分组数据平均数的计算方法(原始数据)n当一组数据未进行统计分类时,若想描述其典型情况,找出其代表值,可计算算术平均数,公式为:nn公式中Xi表示所有数据的和,即Xi=XI+X2+XNnN为数据的个数。.n例如,求某小组10个学生的数学测验分数78,79,62,84,90,71,76,83,98,77的平均数。表一表一三(三(2)班)班30名学生语文、数学、英语期末考试成绩名学生语文、数学、英语期末考试成绩(三科成绩均服从正态分布)学号语数 英学号语数英学号语数英01879385118072762

23、1676571026567741276818222807883037372801366707323848795049486821453576024867775058078761544525325616264067875651649504526687274077580761774818027726966086360581869707328788688095866671973747229828178107074742052435430767585(2)数据分组后计算平均数的方法(频数分布表)n公式为:n表二:三(2)班30名学生语文成绩频数分布表分组区间组中值xc简单频数f相对次数f/N%累积频数

24、FbFa累积百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100x30(3)(3)平均数的特点平均数的特点在一组数据中,每一个数据加上一个常数在一组数据中,每一个数据加上一个常数C C,则所得的平均数为原来的平均数加上常数则所得的平均数为原来的平均数加上常数C C。即:。即:在一组数据中,每一个数据乘上一个常数在一组数据中,每一个数据乘上一个常数C C,则,则所得的平均数为原来的平均数乘上常数所得的平均数为原来的平均数乘上常数C

25、 C。即:。即: 离均差的和等于离均差的和等于0 0。即:。即:(4)平均数的意义与应用n算术平均数具备一个良好的集中量数应具备的一些条件:n反应灵敏。n确定严密。n简明易解。n计算简单。n符合代数方法进一步演算。n较少受抽变动的影响。n缺点:n易受极端数据的影响。n若出现模糊不清数据时,无法计算平均数。n此外,必要注意,凡不同质的数据不能计算平均数。2、加权平均数n(1)加权平均数的概念n加权平均数是不同比重数据(平均数),nW表示各观察值的权数;nX表示具有不同比重的观察值。(2)加权平均数的计算方法n例如,某年级各班的一次数学考试成绩如下:一班45人平均分为80;二班50人平均分为70;

26、三班40人平均分为65;四班50人平均分为80;五班60人平均分为65,求全年级的总平均分。n例2:某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩?不能用:(不能用:(68+75+80)/3=74.33二、中位数n中中数数,又称中点数,中位数。符号为Md中数是指位于一组数据中较大一半与较小一半中间位置的那个数。n中数的求法根据数据是 否分组,而有不同的方法。(一)未分组数据求中数的方法n例1有下列9个数,依大小排列为4、7、8、9、10、11、12、13、14(N=9)n(N+1)/2=5,序列第五的数据是10,则

27、该组数据的中数是10。n例2有下列8个数,依大小排列为:n2、3、5、7、8、10、15、19(N=8)序列为N/2=4者是7,序列为N/2+1=5者为8,则其中数为(7+8)/2=7.5。n从以上两例可以看出,求中数不受极大值与极小值的影响,而决定中数的关键是居中的那几个数据的数值大小。.(二)次数分布表求中数的方法(了解)n其具体步骤如下:n第一步求N/2,并找到N/2所在的分组区间;n第二步求含有中数那一区间以下各区间的次数和记作Fb;n第三步求N/2与 Fb之差;n第四步求序列为第N/2那一点的值。求中数的公式如下:表二:三(2)班30名学生语文成绩频数分布表分组区间组中值xc简单频数

28、f相对次数f/N%累积频数FbFa累积百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100x30中数的意义与应用n优点:计算简单,容易理解,中数的概念简单明了。n缺点:它反应不够表敏;n计算中数时,受抽样的影响较大,不如平均数稳定;n中数乘以总数与数据的总和不相等;n中数不能作进一步代数运算等等。n在一些特殊情况下,它的应用受到重视。这些特殊情况是:当一组观测结果中出现两极端数目时。当次数分布的两端数据或个别数据不清楚时,只能取

29、中数作为集中趋势的代表值。当需要快速估计一组数据的代表值是,也常用中数。三、众数的概念与求法三、众数的概念与求法n众数(Mode)又称为范数,密集数,通常数等,常用符号M0表示。众数是指在次数分布中出现次数最多的那个数的数值。 n(一)直接观察求众数n(二)用公式法求众数n(三)众数的意义与应用n(一)直接观察求众数n只凭观察找出出现次数最多的数据就是众数。n5、8、9、8、4、3、8、1、8、4(二)用公式法求众数n1、皮尔逊的经验法(分数分布为正态分布)nMo=3Md-2M2、金氏插补法(了解)式中Lb为含众数这一区间的精确下限;fa不高于众数所在组一个组距那一分组区间的次数;fb不低于众

30、数所在组一个组距那一分组区间的次数;I为组距 若fa=fb ,则Mo不次数最多那一区间的组中值。 这个公式适合次数分布比较偏斜的情况,当然,比较接近正态分布的出适用。众数的意义与应用n众数的概念简单明了,容易理解;n但它不稳定,受分组的影响,亦受样本变动的影响;n反应不够灵敏,观察众数,不严格计算而来,用计算方法所得众数亦是一个估计值。同时不能作进一步代数运算。n众数也不是一个优良的集中量数,应用也不广泛。n但在下述情况下也常有应用:当需要快速而粗略地寻求一组数据的典型情况时;当一组数据出现同质的情况时,可用众数表示;3、当次数分布中有两极端的数目时,有时也用众数(一般用中数);当粗略估计次数

31、分布的形态时,有时用平均数与众数之差,表示次数分布是否偏态的指标。平均数、中数、众数之间的关系平均数、中数、众数之间的关系n在一个正态分布中,平均数、中数、众数三者相等,因此在数轴上三点重合。n在正偏态分布中MMdM。n在负偏态分布中MMdM。n平均数为一个平衡点,是一组数据的重心。它使数轴保持平衡,即支点两侧的力矩是相等的。n中数:只使其两侧的数据个数相同。n众数:是指次数出现最多的,即重量较大的那个数据。思考与练习题1、应用算术平均数表示集中趋势要注意什么问题?2、对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。(1)4 5 6 6 7 29(2)3 4 5 5 7

32、 5(3)2 3 5 6 7 8 9 3、求下列次数分布的平均数、中数和众数分组f分组f65-135-3460-430-2155-625-1650-820-1145-1615-940-2410-74、求下列四个年级的总平均成绩年级一二三四90.5919294n236318215200第二节教育统计的特征量n二、差异量:代表一组数据离散程度、变异程度的量。(一)全距(R)n最大值与最小值之差(三)方差与标准差方差与标准差n方差(Varance)也称变异数、均方。作为统计量,常用符号S2,x2表示,作为总体参数,常用符号2表示。n标准差(Srandarddeviation)即方差的平方根,常用S或

33、SDx表示。若用表示,则是指总体的标准差。1、方差与标准差的计算、方差与标准差的计算n问题1:某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分为70分)和30,50,86,90,94(均分为70分)。如何评价两组的学习情况?又如:某某研究者对实验班用计算机辅助教又如:某某研究者对实验班用计算机辅助教学,而对照班仍用传统的讲授方式进行教学,期学,而对照班仍用传统的讲授方式进行教学,期末进行统一测试,两班学生的成绩如下,试比较末进行统一测试,两班学生的成绩如下,试比较两种授课方式产生的效果有何不同?两种授课方式产生的效果有何不同?总平均数=81.81平均分标准差D方差和平方和

34、实验班(45)83.765.471.9529.923853 324107对照班(46)79.826.361.9940.453592 288544表1:30名学生英语成绩频数分布表分数组中值XC fFb70-7223065-6752860-5292355-5781450-526630求平均数、标准差和方差2、方差与标准差的意义方差与标准差的意义n方差与标准差是表示一组数据离散程度的最好指标,其值越大,说明离散程度大,其值小,说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。n它基本具备一个良好的差异量数应具备的条件:(1)反应灵敏;(2)有一定的计算公式严密确定;(3)容易计算;(4

35、)适合代数运算;(5)受抽样变动的影响小,即不同样本的标准差或方差比较稳定;(6)简单明了;(7)具有可加性。四、差异系数n当所观测的样本水平比较接近,而且是对同一个特质使用同一种测量工具进行测量时,要比较不同样本之间离散程度的大小,一般可直接比较标准差或方庆功的大小。标准差的单位与原数据的单位相同,有时称它为绝对差异量。n差异系数,又称变异系数、相对标准差等,通常用符号CV表示,其计算公式如下:n(1)同一团体不同观测值的离散程度的比较;(2)对于水平相差较大,但进行的是同一观测的各种团体,进行观测值离散程度的比较。n例题:某校期末考试语文平均成绩为69.3分,标准差为11.2分;英语平均成

36、绩为94.8,标准差为13.8分。问哪一学科离散程度大?n例题:设某考区已录取高中学生语文平均分为69分,标准差为12.5分,而未录取高中的学生语文平均分为40分,标准差为12.5分。比较他们语文成绩的离散程度。CV1=12.5/69*100%=18.12%;CV2=12.5/40*100%=31.25%。未录取学生的离散程度大。n某市区入学男童(7岁组)体重的平均值为20.37kg,标准差为2.16kg;身高的平均值为113.64cm,标准差为4.04cm。问身高与体重那个差异大?由公式课堂练习:练习练习n1、分别用定义公式及原始数据计算、分别用定义公式及原始数据计算3,5,8,9,10的方

37、差和标准的方差和标准差。差。n2、计算下列资料的方差和标准差。、计算下列资料的方差和标准差。分数分数50-55-60-65-70-75-80-85-90-95-总和总和频数频数246112437191294128n3、2002年测得我国年测得我国17岁学生岁学生400M跑成绩,男学生平均数为跑成绩,男学生平均数为92.5秒,秒,标准差为标准差为6.72秒,女学生平均数为秒,女学生平均数为117.0秒,标准差为秒,标准差为10.6秒,试比秒,试比较较17男女学生男女学生400M跑成绩的离散程度。跑成绩的离散程度。第二节教育统计的特征量n相关量:用于描述两个或多个变量间关联程度的量。相关关系相关系

38、数相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。积差相关等级相关点二列相关相关数学与物理、物理与英语相关性比较数学物理英语物理170757675260636063382756575444605660552557055690978597780894889r0.91 0.26 相关系数与相关程度表一览表相关系数与相关程度表一览表| r | 00.30.3|r| 0.50.50.81.0 相关程度零相关微相关切实相关密切相关高度相关完全相关相关关系正相关相关关系零相关负相关积差相关系数n积差相关两组(N30)的正态、且呈线性关系的连续变量之间的相关。积差相关系数的定义

39、公式:积差相关系数的定义公式:积差相关系数的定义n用原始数据计算:用特征量计算:例:P46back等级相关系数n等级相关系数以等级次序排列或以等级次序表示的变量之间的相关Spearman二列等级相关:N不一定必须大于30数学d1物理d2D1704753.50.5260563503822753.5-1.5444760615526557-16901971078038921例:10个学生数学和物理成绩的等级相关分析序号序号数学分数数学分数X X物理分数物理分数Y YX X等级等级Y Y等级等级D DD D2 21949311002909222.5-0.50.25386923.52.511486703

40、.57-3.512.255728254116707665.50.50.257686579-248667685.52.56.25964689811106160101000N=10N=1026点二列相关n在来自总体的两个变量中,一个变量是连续变量,另一个变量是两分变量(男、女;对、错;及格、不及格),点二列相关研究这样两个变量之间的相关关系。相关系数p、q两类变量的平均值连续变量的标准差另一类别频数的比例一类别频数的比例性别男 男 男 男 女 男 男 女 女 女 男 女 女 男 男成绩86 91 90 66 58 99 74 88 72 89 62 65 78 67 85例:某班期末语文考试,从全

41、体考生中随机抽取15名学生的考试成绩,见下表。问该次考试成绩是否与性别有关? P48例题:下表为某一测验中10名考生的卷面总分和一道选择题的得分,试求该选择题的区分度.(与部分的相关)考生ABCDEFGHIJ选择题得分1111001001卷面总分75 57 73 65 67 56 63 61 65 67相关n两个变量都是二分变量,或者可以人为地分为二分变量时,使用相关分析其相关程度。另一类数据合计及格不及格一类数据是aba+b否cdc+d合计a+cb+d例:从体育达标测验的学生中随机抽取60人,其中男、女达标情况见下表,问本次达标测验是否与性别有关?另一类数据合计达标未达标一类数据男20123

42、2女111728合计312960例题:从研究生入学考试中,随机抽取100人,其大学应届与历届毕业生录取情况如下表,问应届与历届大学毕业生同研究生录取与否的相关情况如何?0.23应届录取未录取历届录取301848未录取2032525050100练习练习n1、求以下几何(、求以下几何(X)与代数()与代数(Y)的积差相关系数。)的积差相关系数。X79757773797881767270Y80827677778481727075n2、校方寻某一个年级、校方寻某一个年级8位物理教师课堂教学效果位物理教师课堂教学效果所排列的名次所排列的名次(由低到高排),和这由低到高排),和这8个班级学生个班级学生物理

43、统一测验的平均分数如下表,问教师课堂教物理统一测验的平均分数如下表,问教师课堂教学效果与学生测验成绩是否存在相关?学效果与学生测验成绩是否存在相关?课堂教师效果得分课堂教师效果得分42873615各班平均分数各班平均分数7254807263695169n3、高等教育自学考试已婚与未婚学员的高等数学成绩如下、高等教育自学考试已婚与未婚学员的高等数学成绩如下表,问婚否与成绩是否存在相关?表,问婚否与成绩是否存在相关?成绩成绩7281649367707883797177828076586672677478已婚已婚1未婚未婚0100001011100111111104、从研究生入学考试的学生中,随机抽

44、取60人,其大学应届与历届毕业生录取情况如下表,问应届与历届大学毕业生同研究生录取与否的相关情况如何?应届合计录取未录取历届录取a20b1232未录取C11d1728合计302960n1、第三节利用计算机求特征量n利用计算机求集中量n利用计算机求差异量n利用计算机求相关量利用计算机求集中量(一)n计算算术平均值(AVERAGE)步骤:1.建立Excel工作表、点击fx、选择常用函数或点击统计、选择AVERAGE(算术平均值)、点击确定。2.点击数据组表格框、拖动表格、点击表格框、点击确定。例:利用计算机求集中量(二)n计算中值(MEDIAN)步骤:1.建立Excel工作表、点击fx、选择常用函

45、数或点击统计、选择MEDIAN(中值)、点击确定。2.点击数据组表格框、拖动表格、点击表格框、点击确定。例:BackMODE(众数)的求法与MEDIAN的求法相似利用计算机求标准差n步骤:1.建立Excel工作表、点击fx、选择常用函数或点击统计、选择STDEV(标准偏差)、点击确定。2.点击数据组表格框、拖动表格、点击表格框、点击确定。例:back利用Excel求积差相关系数1.建立Excel工作表、点击fx、选择常用函数或点击统计、选择CORREL(积差相关系数)、点击确定。2.点击数据组表格框(1)、拖动所选数据表格、点击表格框(1),点击数据组表格框(2)、拖动所选数据表格、点击表格框

46、(2)、点击确定。例:利用问卷收集数据正态负偏态正偏态第三讲推断统计n第一节正态分布n第二节总体平均数的估计n第三节几种常用统计检验方法n第四节方差分析概概率率n频率:随机事件频率:随机事件A在在n次试验中出现次试验中出现m次,次,m与与n的比值就是的比值就是随机事件随机事件A发生的频率。发生的频率。n公式:公式:P(A)=m/nn概率:随着试验次数概率:随着试验次数n的无限增大,随机事件的无限增大,随机事件A的频率稳定于的频率稳定于一个常数一个常数P,这个,这个P就是随机事件就是随机事件A出现的概率。可表示为:出现的概率。可表示为:nP(A)m/nn概率的性质:概率的性质:(1)0P(A)1

47、(2)不可能事件的概率等于零。即)不可能事件的概率等于零。即P(v)=0(3)必然事件的概率等于)必然事件的概率等于1。即。即P(u)=1第一节正态分布和正态曲线n最为常见一种概率分布形态,在理论和实践中均有广泛的应用。n(一)密度函数n简记n特征:单峰、对称标准正态分布 (standard normal distribution)的两个参数为:=0,=1 记为 N(0,1) 一般正态分布为一个分布族:N(m,s2) ;标准正态分布只有一个 N(0,1) ;这样简化了应用u-0.00.10.20.30.40.5-4-3-2-101234zf(X)正态曲线( normal curve )图形特点

48、:1.钟型2.中间高3.两头低4.左右对称5.最高处对应于X轴的值就是均数6.曲线下面积为17.标准差决定曲线的形状X Xf f( (X X) )m m正态分布的特征n1、正态分布的形式是对称的,(但对称的不一定是正态分布),它的对称轴是过平均数点的垂线。正态分布中,平均数、中数、众数三者相等,此点y值最大(0.3989)。n2、正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交。012-1-2xy-33=0=1n3、正态曲线下的面积为1,由于它在平均数处左右对称,故过平均数点的垂

49、线将正态曲线下的面积划分为相等的两部分,即各为0.50。0.5二、正态分布表的编制与使用n依据正态分布的密度函数,编制方法:从Z=O开始,逐渐变化Z分数,计算从Z=0至某一定值之间的概率。012-1-2zy-33=0P=1zYn正态表一般包括以下三栏:n第一栏表明Z分数单位, 在平均数这一点上Z=0,在平均数以上(即曲线右侧)Z分数为正值,在平均数以下(即曲线左侧)Z分数为负值。一般正态表上z分数列到3.99,更详细的列到5.00。n第二栏为y(即密度函数或比率数)值,即某一Z分数点上的曲线纵坐标的高度,标准正态曲线下y=0.3989,它是Z=0。这一点上曲线纵坐标具有的最大值或说概率密度值。

50、n第三栏为概率值(常标以P)即不同z分数点与平均数之间的面积与总面积之比。(一)依据Z分数求概率。即已知差度(Z),求面积(P)n1.某Z分数值与平均数(Z=0)之间的概率。nP(0z1)=0.34134=p(-1z0)nP(0z2)=0.47725=p(-2z0)nP(0z3)=0.49865=p(-3z3)=0.5-0.49865=0.00135nP(z1)=0.5+0.34134=0.84134012-1-2zy-33=0P?z3.求两个Z分数之间的概率。n11夹中间面积为夹中间面积为68.26%68.26%,n 即即 P P(1 1Z Z1 1)= 68.26%= 68.26%;n22

51、夹中间面积为夹中间面积为95.46%95.46%,n 即即 P P(2 2Z Z2 2)= 95.46%= 95.46%;n33夹中间面积为夹中间面积为99.73%99.73%,n 即即 P P(3 3Z Z3 3)= 99.73%= 99.73%;012-1-2zy-33=0P=1z2?z1n(二)从概率(P)求Z分数,即从面积求差度值。这种计算的查表方法有以下几种情况:n 1、从平均数开始的概率值已知,求Z值。n p(0z1)=0.34134nP(0z2)=0.47725nP(0z1.645)=0.05, Z.05=1.645nP(z 2.33)=0.01, Z.01=2.33nP(z-1

52、.645)=0.05, nP(z-2.33)= 0.01,012-1-2zy-33=0PZ?3、若已知正态曲线下中央部分的概率,求Z分数是多少n中间面积为中间面积为90%90%,nZ Z.1/2.1/2= =1.645n 即即 P P( 1.645 1.645 Z Z 1.645 1.645 )= 90%= 90%;n中间面积为中间面积为95%95%, nZ Z.05/2.05/2= =1.96n 即即 P P( 1.96 1.96 Z Z 1.96 1.96 )= 95%= 95%;n中间面积为中间面积为99%99%,n Z Z.01/2.01/2= =2.58n 即即 P P( 2.58

53、2.58 Z Z 2.58 2.58 )= 99%= 99%。012-1-2zy-33=0PZ?n(三)求概率的密度Y,即正态曲线的高。n 不论已知概率,还是已知Z值,都可从表的第一或第三栏查对应的第二栏。所知的概率是位于正态曲线的中间部分,还是两尾端部分。这一点要注意区分,才能通过P值查表求得正确的概率密度Y。012-1-2zy-33=0PY?记住以下数据:n1夹中中间面面积为68.26%,n即即P(1Z1)=68.26%;n2夹中中间面面积为95.46%,n即即P(2Z2)=95.46%;n3夹中中间面面积为99.73%,n即即P(3Z3)=99.73%;n1.645夹中中间面面积为90%

54、,n即即P(1.645Z1.645)=90%;n1.96夹中中间面面积为95%,n即即P(1.96Z1.96)=95%;n2.58夹中中间面面积为99%,n即即P(2.58Z2.58)=99%。三、正态分布在测验记分方面的应三、正态分布在测验记分方面的应用用n1、将原始分数转换成标准分数。n2、确定录取分数线n3、确定等级评定人数n4、确定在正态分布下特定分数界限内的考生人数1 1、将原始分数转换成标准分数。、将原始分数转换成标准分数。标准分数的优越性表现在三个方面:标准分数的优越性表现在三个方面:n(1)各种标准分数的单位是绝对等价的,因此,它具有可加性可加性;n(2)标准分数值的大小和正负

55、,可以反映某一考分在全体考分中所处的地位,因此,它具有可比可比性性;n(3)标准分数可以作为舍弃异常数据的依据:如果Z的绝对值大于3,则可考虑舍弃这种原始数据。n例:表一中是该班两同学的期末考试成绩,问:例:表一中是该班两同学的期末考试成绩,问:(1 1)甲甲同学的语文和数学哪科相对较好?同学的语文和数学哪科相对较好? (2 2)甲甲同学和同学和乙乙同学相比,哪一个学业成绩同学相比,哪一个学业成绩较好?较好?项目项目甲甲乙乙所在班级所在班级平均成绩平均成绩标准差标准差语文语文7373626248.348.313.913.9数学数学7979858566.966.918.518.5英语英语7575

56、808067.267.21414合计合计227227227227甲甲同学同学乙乙同学同学项目项目个人个人成绩成绩Z Z个人个人成绩成绩Z Z语文语文73731.77762620.986数学数学79790.65485850.978英语英语75750.55780800.914合计合计2272272.9882272272.878n2、确定录取分数线、确定录取分数线n由录取率可以确定录取分数线,具体步骤为:由录取率可以确定录取分数线,具体步骤为:P00.5-P0=PZX例:某区拟对参加语文竞赛的某区拟对参加语文竞赛的1000人中前人中前200人予人予以奖励,考试的平均分数为以奖励,考试的平均分数为70

57、,标准差为,标准差为10,问授,问授奖的分数线应是多少分?奖的分数线应是多少分?n课堂练习:对参加语文测验的后课堂练习:对参加语文测验的后5050名同学名同学进行课后辅导,问辅导的分数应是多少分进行课后辅导,问辅导的分数应是多少分?3、确定等级评定人数(假定为正态分布)、确定等级评定人数(假定为正态分布)n例:如500名学生学生逻辑思维能力呈正态分布,拟将之分成A、B、C、D、E五个等距的等级,问各等级应有多少人?ABCDEP=6/5=1.2n1、求面积PnA :P(1.8Z)=0.5-0.46407=0.03593nB :P(0.6Z1.8)=0.46407-0.22575=0.23832n

58、C :P(-0.6Z0.6)=0.22575*2=0.4515nD: P(-1.8Z-0.6)=0.23832nE :P(-1.8)=0.03593n2、求人数nA=0.03593*500=17.965=18nB=0.23832*500=119.16=119nC=0.4515*500=225.75=226nD=B=119.16=119nE=A=17.965=18n课堂练习:如100名学生语文能力呈正态分布,拟将之分成优、良、中、差四个等距的等级,问各等级应有多少人?4 4、确定在正态分布下特定分数界限内的、确定在正态分布下特定分数界限内的考生人数考生人数n例:某地区某年高一统一考试数学科考生4

59、. 7万人,平均分为57.08,标准差为18.04。试问:n(1)成绩在90分以上有多少人?n(2)成绩在80分到90分之间有多少人?n(3)成绩在60分以下有多少人?90804.7万人(1)成绩在90分以上有多少人?090zy(2)成绩在80分到90分之间有多少人?n练习:(3)成绩在60分以下有多少人?练习四练习四n1、求下列各组在正态曲线下的面积:、求下列各组在正态曲线下的面积:(1)Z=0Z=1.2(2)Z=0.5Z=2.8(3)Z=0Z=1.4(4)Z=1.5Z=1.8(5)Z=0.5Z=1.8(6)Z=2.5Z=0.8n2、某班、某班36个学生,数学测验的平均分为个学生,数学测验的

60、平均分为80分,标准差为分,标准差为11.5,问在,问在7090分之间,从理论上来讲应有多少人?占全班的百分比是多少?分之间,从理论上来讲应有多少人?占全班的百分比是多少?n3、运用标准分数比较甲、乙两个学生三门学科的总成绩。、运用标准分数比较甲、乙两个学生三门学科的总成绩。考试科目考试科目学学生生班级平均分班级平均分班级标准差班级标准差甲甲乙乙物物理理化化学学数数学学5378827370706574714612n4、某区拟对参加数学竞赛的、某区拟对参加数学竞赛的2000人中前人中前500人予以奖励,考试的平均分数人予以奖励,考试的平均分数为为75,标准差为,标准差为9,问授奖的分数线应是多少

61、分?,问授奖的分数线应是多少分?n5、500名学生逻辑思维能力呈正态分布,拟将之分成名学生逻辑思维能力呈正态分布,拟将之分成A、B、C、D、E五个五个等距的等级,问各等级应有多少人?等距的等级,问各等级应有多少人?第二节总体平均数的估计n一、抽样分布的概念一、抽样分布的概念n抽样分布是指某种统计量的概率分布。抽样分布是指某种统计量的概率分布。n二、平均数抽样分布的几个定理二、平均数抽样分布的几个定理n(一)从总体中随机抽出容量为(一)从总体中随机抽出容量为n的一切可能样本的平均数的平均数的一切可能样本的平均数的平均数等于总体的平均数;等于总体的平均数;n(二)容量为(二)容量为n的平均数在抽样

62、分布上的标准差等于总体标准差除以的平均数在抽样分布上的标准差等于总体标准差除以n的方根;的方根;n(三)从正态总体中,随机抽出容量为(三)从正态总体中,随机抽出容量为n的一切可能样本的平均数的的一切可能样本的平均数的分布也呈正态分布;分布也呈正态分布;n(四)虽然总体不呈正态分布,如果样本容量较大(四)虽然总体不呈正态分布,如果样本容量较大(n30),反映总),反映总体平均数和标准差的样本平均数的抽样分布,也接近于正态分布。体平均数和标准差的样本平均数的抽样分布,也接近于正态分布。n三、标准误三、标准误n某种统计量在抽样分布上的标准差称为该种统计量的标准误。某种统计量在抽样分布上的标准差称为该

63、种统计量的标准误。四、t分布n当总体标准差未知,而用估计量S来代替,这时一切可能样本平均数与总体平均数的离差统计量t呈t分布。n(一)t分布与正态分布的异同n(二)自由度df:是指总体参数估计量中变量值独立自由变化的个数。自由度df等于样本容量减去限制因子的个数。t分布(T-distribution)nt分布是统计分析中应用较多的一种随机变量函数的分布,是统计学者高赛特(Goeset)1908年在以笔名Student发表的一篇论文中推导的一种分布。(一)t分布的意义与特点n当样本容量n时,它是正态分布,当n30以上时接近正态分布,当n30时,此分布不接近正态分布。而是具有左右对称,高狭峰的分布

64、,且分布形状随样本容量n-1的变化而变化的一族分布。这就是t分布。它的函数为 df为自由度df=n-1T分布密度曲线图nt分布与无关而与n-1(自由度)有关,t分布的自由度(符号v或df表示)一般为n-1,即样本容量减1。自由度自由度( (degrees of freedom)是指任何变量中可以自由变化的数目。是t分布的参数v,因为v代表t分布中独立随机变量的数目。故曰自由度。t分布的特点可归纳如下:nt分布的平均值为0。n是对于平均值0对称的分布,分布左侧t为负值,分布右侧t为正值。nt变量取值在一一+之间。n当样本容量趋于时,t分布为正态分布,方差为1,而当n-1大于30以上时,t分布接近

65、正态分布,方差大于1,随n-1之增大而方差渐趋于1,当n-130时,t分布与正态分布相差较大,随n-1减少,离散程度(方差)越大,分布中间部分低面分布的尾部较高.(二)t分布表的使用nt分布的形态随自由度而变化,它有一族分布, 附表2(p452)是常用的t分布表。n该表左列为自由度,n最上一行是指不同自由度下t分布两尾部端的概率(双侧界限),分别为0.5,0.4,0.3,0.2,0.1,0.05,0.01,0.00l等,n这些概率是指某一t值时,t分布两尾部端概率的和,而表的最下一行标明的是单侧界限,即从某t值以下t分布尾部一端的概率,因而单侧概率是双侧概率的一半。表中所列的值为t值,它随自由

66、度及概率不同而变化。t分布表的使用分布表的使用n不同统计学教材提供的t分布表可能不同。返回返回n例如df=20,最大t值的概率为0.05(双侧概率)t值为2.086,意思是在t 小于2.086以下的概率与t大于2.086以上的概率和为0.05亦即该两部分尾端的面积和与总面积之比率为0.05。双侧概率常写作t/2上例t.05/2=2.086。单侧概率则只计算一侧尾部的概率,故单侧概率为双侧概率的一半,常写作t,上例则可写作t.025=2.086。n以上是已知自由度及概率查t值,有时常常要根据已知的自由度与t值,查相应的概率。五、总体平均数的参数估计n根据样本统计量对相应总体参数所作的估计叫总体参

67、数估计。分为点估计和区间估计。在这里只介绍总体平均数的区间估计。n(一)总体标准差(一)总体标准差已知或已知或总体标准差虽未知,但样本总体标准差虽未知,但样本容量容量n30的情况的情况n在这种情况下,一切可能样本平均数与总体平均数的离在这种情况下,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布。差统计量呈标准正态分布。总体平均数的区间估计n当1-=95%,则有:总体平均数的区间估计n当1-=99%,则有:例:已知母总体为正态分布,标准差为7.07,从这个总体中随机抽取n1=10的样本,计算平均数分别为78,试问总体参数u的.95和.99的置信区间.因为总体分布为正态,且总体方差已知,

68、故进行z估计.练习:n某中学二年级语文同一试卷测验分数历年来的标准差为10.6。现从今年测验中随机抽取40份试卷,算得平均分为72,试求平均数标准误,并求该校此次测验95%置信区间。总体平均数的区间估计n(二)总体标准差(二)总体标准差未知,且样本容量未知,且样本容量n30的情况的情况n在这种情况下,一切可能样本平均数与总体平均数的离在这种情况下,一切可能样本平均数与总体平均数的离差统计量差统计量t呈呈t分布。分布。总体平均数的区间估计n当1-=95%,则有:n当1-=99%,则有:n例,某班49人期末考试成绩为85分,标准差为6,假设此项反映学生的学习水平,试推论该班学生学习的真实成绩分数?

69、练习;n已知某校高二10名学生的物理测验分数为92,94,96,66,84,71,45,98,94,67,求此次测验全年级标准差的估计值,并估计全年级平均分数的95%置信区间。应用举例:学生成绩的初步分析分段统计分数段人数905分数分布形态注:(1)各分数段的区间大小应根据实际需要确定。(2)一般要求学生的成绩分布为正态或负偏态。练习五练习五n1、某中学二年级语文同一试卷测验分数历年来的标准差、某中学二年级语文同一试卷测验分数历年来的标准差为为10.6。现从今年测验中随机抽取。现从今年测验中随机抽取10份试卷,算得平均分份试卷,算得平均分为为72,试求平均数标准误,并求该校此次测验,试求平均数

70、标准误,并求该校此次测验95%置信区置信区间。间。n2、从某县高中一年级数学测验中抽、从某县高中一年级数学测验中抽52份卷子,算得平均份卷子,算得平均分为分为71.4,标准差为,标准差为11.3,求平均数标准误,并估计全县,求平均数标准误,并估计全县高一年级此次测验高一年级此次测验99%置信区间。置信区间。n3、已知某校高二、已知某校高二10名学生的物理测验分数为名学生的物理测验分数为92,94,96,66,84,71,45,98,94,67,求此次测验全年级标,求此次测验全年级标准差的估计值,并估计全年级平均分数的准差的估计值,并估计全年级平均分数的95%置信区间。置信区间。n作业:某县初中

71、毕业班一次语文考试成绩服从正态分布,在全县范围内随机抽取试卷30张,成绩如下:81,72,71,54,74,74,68,76,90,50,55,68,94,58,84,69,82,70,69,74,83,90,75,44,56,68,78,84,72,64,估计全县总平均分在什么范围?第三节几种常用的统计检验方法n一、统计检验的意义n二、假设检验的步骤n三、统计检验方法一、统计检验的意义n(一)假设与假设检验n假设一般专指用统计学术语对总体参数所做的假定性说明。n假设检验:通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称做假设检验(hypothesis te

72、sting).nn假设检验包括参数检验和非参数检验.n参数检验(parametric test):若进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验.n非参数检验(non-parametric test): 若对总体分布形式甚少,需要对未知分布函数的形式及其他特征进行假设检验.n假设:n原假设(虚无假设,零假设,无差假设):nHO:UU0n科学假设、研究假设(备择假设,真实假设,期望假设):HI:U30,比较两个平均数的差异是否显著,用Z检验。n1、单总体Z检验n2、双总体Z检验1、单总体Z检验n单总体Z检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。原总体为正

73、态分布,方差 的已知,样本平均数的抽样分布为正态分布。n例:全区统一考试数学平均分。=62,n标准差0=10.2分。某校90名学生该次考试的平均成绩为68,问该校成绩与全区平均成绩差异是否显著。n例:全区统一考试数学平均分。=62,n标准差0=10.2分。某校90名学生该次考试的平均成绩为68,问该校成绩是否显著高于全区平均成绩?2、双总体Z检验n双总体Z检验是检验两个样本平均数各自代表的总体的差异是否显著,双总体Z检验主要适用于独立大样本平均数差异的显著性检验,当两个样本的容量都大于30的独立样本则称为独立的大样本。n n例:从某地区的六岁儿童中随机抽取男生30人,身高平均为114cm,抽取

74、女生 27人平均身高为112.5cm。根据以往资料,该地区六岁男童身高的标准差为5cm。女童身高的标准差为6.5cm,能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童的身高有显著性差异。课堂练习n1、在参加了全国统一考试后,且已知考生成绩呈正态分布。在甲省抽取了153名考生,得到平均分为57.41分,且该省的总标准差为5.77分,在乙省抽取了686名考生,得到平均分为55.95分,该省的总标准差为5.17分,问两省在该次考试中,平均分是否有显著的差异?Z=2.882、T检验n总体分布为正态,当其方差未知时,样本平均数的抽样分布为t分布,t检验1、单总体T检验n总体分布为正态,当其方差未知

75、时,样本平均数的抽样分布为t分布,t检验n(df=n-1)n例:学生的学习成绩与教师的教学方法有关.某校教师采用了一种他认为是新式有效的教学方法,经过一学年的教学后,从该教师所教班级中随机抽取了6名学生的考试成绩,分别为48.5,49,53.5,49.5,56,52.5,而在该学年考试中,全年级的总平均分为52,试分析采用这种教学方法与未采用新教学方法的学生成绩有无显著差异(已知考生成绩服从正态分布)n在实际使用中,当n30时,t分布常常被近似地按正态分布对待,这时检验近似的应用Z检验()n但n30时则必须用t检验。因此Z检验又叫大样本检验,t检验又叫小样本检验。但是,由于n时t0.05/2才

76、等于1.96,除此之外,一般t总是大于Z。因此,在理论上(或实际应用要求严格时),中要总体为正态分布、总体方差已知,不论n30还是n2,这时2分布的n平均数:nn方差:n5.2分布是连续型分布,但有些离散型的分布也近似2分布(三)2分布表的编制与使用n2分布表是根据2分布函数计算出来的,2分布曲线下的面积都是1。但随自由度不同,同一2值以下或以上所含面积与总面积之比率不同。故一般2表,要列出自由度、及某一2值以上2分布曲线下的概率。见附表12。n 附表12所列的各数值:表的左列为自由度,表的最上一行是概率值,即不同自由度时,某某2 2以上的以上的概率。概率。表中所列为不同自由度及概率下的2值,

77、例如df=1时,在2=0.00004以上的概率为0.995,那么在其以下的概率为:n1-0.995=0.005在2=0.455以上或以下的概率各为0.5,。在2=7.88以上的概率为0.005,在其以下的概率为:1一0.005=0.9952分布表的使用返回n当df=20时,2=10.9,其值以上的概率为0.95,有时写作:2.95=10.9。确定其概率下的2相等,这时确定其概率,可取邻近值的某一概率,或可用内插法,作稍准确些的计算。n2分布在统计分析中应用于计数数据的假设检验以及样本方差与总体方差差异是否显著的检验nX检验方法能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否一致问题

78、,或说有无显著差异问题。n所谓实际频数(Actual frequencies),简称实计数或实际数,是指在实验调查得到的计数资料,又称为观察频数(observed frequencies )。n理论次数(theoretical frequencies)是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,称为期望次数(expected frequencies )。X检验的假设n(一)分类相互排斥,互不包容n(二)观测值相互独立n让观测值的总数等于实验中不同被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。X检验的基本公式X2检验方法检验的是样本观测

79、次数f0(或百分比)与理论fe或总体次数(百分比)的差异性。 X2检验的统计原理,是比较观察值与理论值的差别,如果差异越小,检验结果越不容易达到显著性水平;两者差异越大,检验的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而接受备择假设。n例10-1:随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异?练习:某项民意测验,答案有同意、不置可否、不同意3种。调查了48人,结果同意的24人,不置可否的12人,不同意的12人,问持这3种意见的人数是否有显著不同?用SPSS检验无差假说n建立数据文件,定义变量名:各意见为grou

80、p,人数为“data”。n从选择“data”“weightcase”,进入“weightcase”对话框.把date放入“frequencyvariable”栏中定义人数为权数,单击“ok”n从AnalyzeNonparametrictestChi-Square,进入Chi-Square对话框,现欲对不同意见进行分布分析,故在对话框左侧的变量列表中选group,点击向右箭头使之进入testvariablelist框,点击OK。结果如下表教育测量篇n教育测量概述教育测量概述n测验的信度测验的信度n测验的效度测验的效度n题目的难度题目的难度n题目的区分度题目的区分度n教育测验的编制与实施教育测验的

81、编制与实施n测量是根据法则给事物赋予数量。测量是根据法则给事物赋予数量。n测量的三要素(参照点、单位、量具)测量的三要素(参照点、单位、量具)参照点:为测定事物的量,事先确定的参照点:为测定事物的量,事先确定的计量起点计量起点n绝对零点:计量起点在内容丝毫不存在一点量绝对零点:计量起点在内容丝毫不存在一点量n相对零点:共同约定的零点作为测量的起点(不存在倍数关系)相对零点:共同约定的零点作为测量的起点(不存在倍数关系)单位:实施测量必须有统一的单位单位:实施测量必须有统一的单位n具有明确的意义,即:大家对同一个单位的理解一致具有明确的意义,即:大家对同一个单位的理解一致n测量过程中单位测量过程

82、中单位“距离距离”的不变性,即:单位的实际价值处处相同的不变性,即:单位的实际价值处处相同量具:测量工具量具:测量工具n具有准确性具有准确性n具备操作的简约性具备操作的简约性n教育测量工具:试卷教育测量工具:试卷测试题测试题重视命题的研究重视命题的研究n量表:根据测量目的所设计的测试项目和赋值规则量表:根据测量目的所设计的测试项目和赋值规则第四讲教育测量的概述教育测量n教育测量就是对教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依一定的规则将考核的结果予以数量描述。如对学生的思想品德、健康状况、学业成绩等的测量。特点:n间接性和推断性n测量对象的模糊性和测量误差的不可避免性n量表

83、的多样性,结果具有相对抽象性量表的类型1.称名量表称名量表n类别量表,最低层次的量表,用于分类,表示事物的不同类别和性质类别量表,最低层次的量表,用于分类,表示事物的不同类别和性质用数字表示每一个研究个体:学号、准考证号用数字表示每一个研究个体:学号、准考证号用数字代表事物的类别:用数字代表事物的类别:“1”、“0”表示表示“好好”、“坏坏”2.顺序量表顺序量表n也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类客也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类客体中各元素之间的相对顺序体中各元素之间的相对顺序只关心研究对象的顺序,不问津间距是否一致只关心研究对象的顺

84、序,不问津间距是否一致合格与否、优良中差等合格与否、优良中差等3.等距量表等距量表n间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的测间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的测量值由明确的距离关系量值由明确的距离关系原始测验分数经过统计处理后推导出一种新的量表分数,此分数的原始测验分数经过统计处理后推导出一种新的量表分数,此分数的“零点零点”是一个相对零点是一个相对零点4.比率量表比率量表具有等距量表的一切性质,采用绝对零点。具有等距量表的一切性质,采用绝对零点。针对总体而不是样本针对总体而不是样本不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间

85、的倍不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的倍数关系数关系有关量表水平的说明事物的复杂性决定测量量表的不同层次和水平四种量表的测量水平由前往后逐渐提高,信息量不断增大,前一种量表的特点和功能蕴涵于后一种量表之中。(定性、定量)不可过分苛求测量的高层次不能把低层次量表的数据按高层次量表的意义理解或作统计处理教育测量是在顺序量表上进行的,但需要用等距量表报告分数n加强命题的研究n把原始分数转换到一个有相等单位的量表上,通常转化为标准分教育测量的种类一、按测评在教学中运用的时机分类n1、形成性测验n在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。形成性测验对于教

86、师以及学生的作用。2、诊断性测验n对经常表现出学习困难的学生所作的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。诊断性多半是在形成性测评后实施。3、终结性测验n用于教学结束后,在性质上相当于现在学校中所进行的期末考试。其目的有两个:其一是在教学目标之下,检查学生一学期的学业程度;其二是根据终结性测评的结果,评定学业成就,并通知学生家长或记入档案。二者的区别:n第一,形成性测验在每个教学单元结束时都要进行,是经常性的。终结性评价是在整个教学或其中重要部分结束时才进行。n第二,形成性测验的主要目的不是为学生提供证明,而是致力于引导学生掌握他所具备的知识面,并试图发现学生错误的起因,从而采

87、取因人施教的补救措施。而终结性测验的主要目的是评定学生成绩,为学生具有某种能力或资格作证明。n第三,形成性测验的内容一般限制在一个教学单元的范围内;而终结性测验内容涵养一门学科,对学生能力的概括水平高于形成性测验。三、按测评被试行为表现的性质分类n1、最佳行为测验n以测量被试的最佳行为表现为目的。凡是以成就或能力的高低行为评价基础的,都属最佳行为测验。2、典型行为测验n典型行为测验目的不在测评被试能力的高低,而是测评其是否具备某种典型行为。四、按测验的内容分类n1、智力测验n目的在于测量被试的智力并对被试的智力发展水平和特点作出评价。2、能力倾向测验n目的在于测量与评价个人的潜在才能,预测个人

88、能力发展倾向。分为两种:一是关于能力测验;一是特殊能力倾向测验。3、成就测验n目的在于测评个人在接受教育或者训练后的成就。常见的两种:一是学科成就测验;一是综合成就测验。4、人格测验n也称为个性测验,其目的在于测评被试的人格心理特征。本测量与评价所涉及的内容层面也很多。五、教育测验的其他分类n(一)按测量对象1、个别测验n指的是同一主试在同一时间内只能测量一个被试。主试与被试有更多的交流机会,对于一些特殊的被试,如幼儿、文盲等,只能采用个别测量与评价。但是个别测量费时、费力,特别主试必须经过严格的训练才能胜任。2、团体测验n指的是同一时间内由一位主试测量多位被试。优点是节省时间,可以在短时间内

89、收集到大量的数据,不足是不易有效控制被试的行为,容易产生误差。(二)按测量材料n1、文字测验n测量的内容是以文字的形式表现的。n2、非文字测验n测量的内容是通过图形、仪器、工具、实物、模型等形式表现的。(三)按量具的标准化程度可分为标准化测验和非标准化测验n标准化测验是指由测量专家按照测验程序而编成的一种测验。n非标准化测验是指测验的编制相对自由,没有严格按照测验编制的程序进行。(四)按测验的范围分类n宏观的教育测验:以教育的全领域或涉及宏观决策方面的教育现象、措施为对象的教育评价。n中观的教育测验:以学校内部各方面工作为对象的教育评价。n微观的教育测验:以学生的发展变化为对象的教育评价。教育

90、测量的功能n一、要教学方面的功能n1、反馈功能n2、激励功能二、教育测量在行政管理方面的功能n1、评价功能n2、选择功能三、在教育科学方面的功能n1、导向功能n2、研究功能良好测验的特征n一、可靠性(信度)n二、有效性(效度)n三、难易性(难度)和鉴别性(区分度)n四、实用性(可操作性)学习教育统计测量的意义n(1)认识教育现象,了解教育规律;n(2)顺利阅读教育科研报告和文献,指导教育科研;n(3)有效地检查和评价教学,科学地选拔人才;n(4)提高教育工作的科学性和效率。第五讲测验的信度n信度信度(reliability):测验的稳定性、可靠性程度。n信度的统计定义n信度的种类重测信度重测信

91、度:同一测验同一测验对同组被试先后两次施测先后两次施测所得结果的一致性程度。复本信度复本信度:两平行测验平行测验对同组被试施测施测所得结果的一致性程度。同质性信度:测验内部所有题目间的一致性程度。复本信度的估计方法高数高数X高数高数Yx=X- y=Y-x2y2xy李安李安7177+1-4116-4李连杰李连杰6888-2+7449-14赵明赵明7882+8+16418何其兵何其兵6276-8-5642540郭宇郭宇6478-6-336918成小亮成小亮6675-4-6163624露思露思7184+1+3193玛丽玛丽7380+3-191-3汤姆汤姆7783+7+249414杰克杰克70870+

92、603607008100024418686内部一致性系数n这是求同一次测验的奇数测题与偶数测题这两部分得分的相关系数。n分半信度的计算方法:n(1)先计算两半测验得分的皮尔逊积差相关系数。n(2)再用斯皮尔曼布朗公式校正:r=例题:被试010203040506070809101112131415奇数题(x)2018232117182017161314131288偶数题(Y)2022192218151417151614121076n练习:设有练习:设有14名学生,经过一项测验,成绩如下表:本拟名学生,经过一项测验,成绩如下表:本拟再测一次以估计其信度,由于学生放假离校,不便再测。再测一次以估计其

93、信度,由于学生放假离校,不便再测。现拟估计其测验结果的信度。用什么方法估计?测验的信现拟估计其测验结果的信度。用什么方法估计?测验的信度系数如何?度系数如何?n14名学生某项测验成绩如表名学生某项测验成绩如表n例题:某态度量表共7题,100个被试在各题上的得分方差分别是0.81,0.82,0.79,0.83,0.85,0.76,0.77,测验总分的方差为14.00,则此测量的的信度为多少?解该测验的信度是0.698练习:用6个论文题的测验对5个学生施测,其结果如表所示,试估计测验的内在一致性信度.学生n=5题序(K=6)总分Xt123456134321417263454628313124516

94、462215319553124217提高测验信度的方法n第一,测题要有一定数量。题目较少,测题抽样越受偶然性影响信度也越低。n第二,测题难度要适中。难度太大或太小得分普遍高或普遍低,就会降低信度。n第三,测题内容要单纯集中,不宜过于庞杂。n第四,测验时间要充分。n第五,评分要客观。n1、设有、设有14名学生,经过一项测验,成绩如下表:本拟再名学生,经过一项测验,成绩如下表:本拟再测一次以估计其信度,由于学生放假离校,不便再测。现测一次以估计其信度,由于学生放假离校,不便再测。现拟估计其测验结果的信度。用什么方法估计?测验的信度拟估计其测验结果的信度。用什么方法估计?测验的信度系数如何?系数如何

95、?n14名学生某项测验成绩如表名学生某项测验成绩如表rx1x2=0.948,rxx=0.97第六讲测验的效度n效度效度(Validity):测验的有效性程度,即测验实际测量出其所要测量特性的程度。效度始终是针对一定测量目的而言的效度只有程度上的差异效度要从多方面、多角度加以验证n效度的统计定义n从某种意义上说,效度比信度更重要。内容效度内容效度:测验题目样本对于应测内容与行为领域的代表性程度。逻辑分析结构效度结构效度:测验反映某种理论构想的准确性程度。因素分析n内容效度与结构效度一般没有适当的计算方法。效标关联效度一般用积差相关系数表示,如,求出入学测验分数与期末测验分数的相关系数。效度指标一

96、般认为在0.6以上是有效测验。效标关联效度效标关联效度:测验对于特定情境下个体行为进行预测的有效性程度。相关分析效标:判断测验效度(预测有效性)的外部标准。效度的种类及其分析方法一个测验要具有较高的内容效度必须具备两个条件:n1、测验内容范围明确、测验内容范围明确n测验内容范围明确是指测验必须明确界定所要测验的内容范围。对于测验内容范围明确是指测验必须明确界定所要测验的内容范围。对于学生学业成绩测验,我们较容易确定内容范围。因为这种测验的主要学生学业成绩测验,我们较容易确定内容范围。因为这种测验的主要目标在于测验学生在某一学科中学习的效果,因此测验题目必须符合目标在于测验学生在某一学科中学习的

97、效果,因此测验题目必须符合教材内容,依据教学大纲,把握教学大纲所界定的重点难点,同时,教材内容,依据教学大纲,把握教学大纲所界定的重点难点,同时,教学目标必须由试题反映出来。对于心理测验,内容效度不容量明确,教学目标必须由试题反映出来。对于心理测验,内容效度不容量明确,因此,内容效度一般用于考查学生学业成绩测验的有效性。因此,内容效度一般用于考查学生学业成绩测验的有效性。n2、取样具有代表性、取样具有代表性n取样具有代表性是指测验题目对欲没的全部内容覆盖面要大。对学生取样具有代表性是指测验题目对欲没的全部内容覆盖面要大。对学生学业成绩测验而言,在编制题目时应对有关的教学大纲、教科书乃教学业成绩

98、测验而言,在编制题目时应对有关的教学大纲、教科书乃教学目教学目标进行系统分析,然后确定各种行为目标题目所占比重,学目教学目标进行系统分析,然后确定各种行为目标题目所占比重,最后选择和确定好测验题目。最后选择和确定好测验题目。内容效度的评估n1、逻辑分析法n用逻辑分析法估计内容效度,主要是指依据教材内容,教学大纲的范围及教学目标分析测验内容,检查测验内容究竞在体现教材内容和教学目标方面达到多大程度。教材内容由教学大纲规定,学生预期的行为变化情况由教学目标规定,教学目标主要是指布卢姆的认知目标,包括对教材内容的认记、理解、应用、分析、综合以及评等方面的能力。因此,判断内容效度时,必须按照教学大纲和

99、教学目标对测验试题逐一进行认真而细致的分析审查。审查包括各种测验类型题目的比例是否恰当,题量是否合理,难易是否适度,题目对教材内容和教学目标是否具有代表性和典型性。即对测验内容进行逻辑推理的评判分析。其缺点是没有数量指标来描述教材内容、教学目标与测验试题的一致性程度;主观性评判难以做到客观、准确。内容效度的评估n2、用测验题目与教材内容比较的方法、用测验题目与教材内容比较的方法n此法第一步便是内容范围的确定。在教育测验中,测验欲测之内容范围是以命题双向细目表来确定和详细描述。它包括教育目标和教育内容两个大难度,各难度又分为若干小类,表中列出每一类的相对比例。n第二步是分析测验的每一项目,确定它

100、们所涉及的知识和技能,列出同类题目(涉及同一内容和目标)及其分数在测验中所占比例。n最后得测验的内容结构与测验欲测之内容范围结构(即双向细目表)相对照。制定评定量表,计算测验内容对其内容范围的覆盖率,从而得到内容效度的指标。n3、统计分析法(简介)、统计分析法(简介)n统计分析法主要是采取定量分析手段来描述测验的内容效度。有以下几种方法:n(1)克龙巴赫法(2)评分一致性考查方法(3)前后测比较法提高测验信、效度的方法第一,要控制系统误差,即控制测验过程的误差,包括:第一,要控制系统误差,即控制测验过程的误差,包括:测量标准的失真,题目的复杂现象,题目与指导语有暗测量标准的失真,题目的复杂现象

101、,题目与指导语有暗示性,答案具有明显的规律性。示性,答案具有明显的规律性。第二,精心编制测题,分析教学目标,编制双向细目表,第二,精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测题有必要的覆盖面。另外:测题表述简明易懂,测题有必要的覆盖面。另外:n测验中题目的数量应适当,不能太少。测验中题目的数量应适当,不能太少。n紧密围绕教学大纲和教学目标命题。紧密围绕教学大纲和教学目标命题。n考核内容应全面,并能有效代表学生应掌握的知识领域。考核内容应全面,并能有效代表学生应掌握的知识领域。n测验的整体难度适当,不同类型、不同难度的题目应保持恰当比例。测验的整体难度适当,不同类型、不同难度

102、的题目应保持恰当比例。n少出偏题、怪题,一般应以考察基础知识和基本能力为主。少出偏题、怪题,一般应以考察基础知识和基本能力为主。第三,妥善组织测验等。第三,妥善组织测验等。作业:n1、试述用逻辑分析法估计内容效度。n2、什么是效度,提高测验效度的方法有哪些?n3、什么是效标,选择效标时要注意什么?第七讲难度()n含义:试题的难易程度。P值越大,试题越容易。难度系数的估计难度系数的估计0、1计分()P=R/N;(R:答对人数,N:被试总人数。)()当被试较多时,将分数由高到低排序,可从高分和低分各取27%,形成高分组和低分组,然后以高分组的答对率和低分组的答对率(和)的平均数作为该题的难度。(2

103、)0、1计分多重选择题难度校正nk:每个测题可供选择的答案;nP:未校正测题的难度;nCP:校正测题难度。3.非0、1计分(解答题)0.30.50.7难中易极端分组法n对主观性试题,被试人数较多时,可采用极端分组法计算项目难度:nn在这里,X为高分组所得该题总分;nX为低分组所得该题总分;H为该题的最高得分;nL为该题的最低得分;nN为被试总人数的25%。用极端分组法计算主观性试题难度的基础步骤为:n(1)按测验总分依次排序,确定比例各为25%的高分组和低分组;n(2)为高低分组编制每题得分的分析表;n(3)用公式计算项目难度值。n例:有100名考生参加论文式测验按高低分各占总人数的25%分组

104、,其中第6题的得分统计表如下表。求该题材的难度。n论文式试题分析表以上分析表中,(以上分析表中,(X)栏为该题得到的各种分数,()栏为该题得到的各种分数,(f)栏为各种)栏为各种分数的人数,(分数的人数,(fX)栏为各种分数与各种人数的乘积。)栏为各种分数与各种人数的乘积。n解:已知N=25,X=211,X=146,H=10,L=4。n则有:nP=0.523n即,这道题的难度为0.523。难度对测验的影响n1、难度对测验分数分布的影响、难度对测验分数分布的影响n(1)P值越小值越小测验项目越难测验项目越难测验分数集中在低分端测验分数集中在低分端分分数分布呈正偏态分布。数分布呈正偏态分布。n(2

105、)P值越大值越大测验项目越易测验项目越易测验分数集中在高分端测验分数集中在高分端分分数分布呈负偏态分布。数分布呈负偏态分布。n即:测验项目过份容易或过份难,都会造成测验分数偏离正态分即:测验项目过份容易或过份难,都会造成测验分数偏离正态分布,而使测验分数的离散程度变小。布,而使测验分数的离散程度变小。n2、难度对测验鉴别力的影响、难度对测验鉴别力的影响n测验的主要功效之一就是鉴别考生实际水平的高低。自欺欺人适量难测验的主要功效之一就是鉴别考生实际水平的高低。自欺欺人适量难度可以加大考生得分的差异,从而提高测验的鉴别力。度可以加大考生得分的差异,从而提高测验的鉴别力。nP值越接近值越接近0.50

106、,试题的鉴别能力就越高;相反,试题的鉴别能力就越高;相反,P值越接近值越接近1.00或或0,试题的鉴别能力就越低。,试题的鉴别能力就越低。3、难度与测验目的的关系n项目难度应根据测验目的来确定,不能认为测验项目都必须保持值等于项目难度应根据测验目的来确定,不能认为测验项目都必须保持值等于0.500.50最好。事实上,一方面,如果每个项目的难度都等于最好。事实上,一方面,如果每个项目的难度都等于0.500.50,测验项,测验项目之间存在高度相关,会使测验分数的分布呈双峰状态,即有目之间存在高度相关,会使测验分数的分布呈双峰状态,即有5%5%的人所的人所有题目都答对,得满分,另外有题目都答对,得满

107、分,另外5%5%的人全部答错,得的人全部答错,得0 0分。为此,难度水分。为此,难度水平的确定应根据测验的目的,性质及题目的形成。平的确定应根据测验的目的,性质及题目的形成。n(1 1)对于一般的常模、参照测验而言,其目的在于测量个体差异,一)对于一般的常模、参照测验而言,其目的在于测量个体差异,一般只要求测验题目的平均难度为般只要求测验题目的平均难度为0.500.50,而个题难度可在,而个题难度可在0.50+0.200.50+0.20之间之间 。n(2 2)当测验用与选拔或诊断时,题目的难度值应更多地接近录取率。)当测验用与选拔或诊断时,题目的难度值应更多地接近录取率。n(3 3)就选择题而

108、言,)就选择题而言,P P值应大于概率水平。值应大于概率水平。P P值若等于概率,说明被试值若等于概率,说明被试纯粹凭猜测作答;纯粹凭猜测作答;P P值若小于概率,说明题目很可能存在问题。值若小于概率,说明题目很可能存在问题。n(4 4)整个测验的难度水平取决于组成测验的题目的难度。)整个测验的难度水平取决于组成测验的题目的难度。练习七练习七(教材(教材P239,T3、4)n1、有、有100名学生参加某学名学生参加某学科测验,高分组与低分组科测验,高分组与低分组人数各取总人数的人数各取总人数的27%,其中第一题高分组答对的其中第一题高分组答对的有有20人,低分组答对的有人,低分组答对的有12人

109、。这道题的难度是多人。这道题的难度是多少?少?n2、有、有100名考生参加某论名考生参加某论文试题的测验,按高低分文试题的测验,按高低分各占总人数的各占总人数的25%分组,分组,其中第其中第5题得分统计如题得分统计如右表,试计算该题的难度右表,试计算该题的难度与区分度。与区分度。P=0.593P=0.512第八讲区分度(D)n区分度区分度:题目区分被试能力、水平的能力,又称鉴别力。n区分度的估计方法区分度的估计方法n一、相关法一、相关法:n计算题目得分与总分相关。其中积差相关积差相关适用于多值计分题目;点二列相关点二列相关适用于二值计分题目。1、多值计分题目(如简答、论述)、多值计分题目(如简

110、答、论述)题目分题目分X总分分Yx=X-y=Y-x2y2xy里沙里沙130-2-404160080露思露思280-1101100-10玛丽玛丽38001001000汤姆汤姆4601-101100-10杰克杰克510023049006015350102800120区分度估计值:题分与总分的积差相关系数。区分度估计值:题分与总分的积差相关系数。2、二值计分题目(如选择、填空、判断)、二值计分题目(如选择、填空、判断)学生学生 ABCDEFGHIJKL总分总分908180787770696555504942题分题分101111100010区分度估计值:题分与总分的点二列相关系数区分度估计值:题分与总

111、分的点二列相关系数二、极端分组法1.0、1计分(客观性试题)高低分组法高低分组法:以高分组和低分组在特定题目上得分率之差作为衡量区分度的指标。2、非0、1计分(主观性试题)nH H:高分组得分总和;:高分组得分总和; L L:低分组得分总和:低分组得分总和nX XH H:最高分:最高分 ; X XL L:最低分;:最低分;nN N:高分(低分)组的人数。:高分(低分)组的人数。n例:有100名考生参加论文式测验按高低分各占总人数的25%分组,其中第6题的得分统计表如下表。求该题材的难度。n论文式试题分析表n解:已知N=25,X=211,X=146,H=10,L=4。n则有:nD=0.433n即

112、,这道题的区分度为0.433。nD值范围在值范围在-1.00和和+1.00之间,值越大,之间,值越大,试题的区分能力越强。当试题的区分能力越强。当D为正值时,说明为正值时,说明试题是积极区分,即高分组通过率高,低试题是积极区分,即高分组通过率高,低分组通过率低。为分组通过率低。为D负值时,说明试题有消负值时,说明试题有消极区分,高组通过率低,低组通过率高。极区分,高组通过率低,低组通过率高。D为为0时,说明试题无区分用。时,说明试题无区分用。区分度与难度的关系n试题的区分度与难度有密切关试题的区分度与难度有密切关系。试题难度过大或过小,其系。试题难度过大或过小,其区分度都较低。当难度值为区分度

113、都较低。当难度值为1.00或或0时,高分组和低分组或时,高分组和低分组或全部通过得满分,或全部未通全部通过得满分,或全部未通过得过得0分,这时区分度都为分,这时区分度都为0分。分。这两种情况,都表示试题没有这两种情况,都表示试题没有鉴别考生水平高低的能力。所鉴别考生水平高低的能力。所以,调整试题难度是提高试题以,调整试题难度是提高试题区分度的重要方法。右表可说区分度的重要方法。右表可说明难度与区分度的关系。明难度与区分度的关系。区分度与信度的关系n一个良好的测验,信度必一个良好的测验,信度必须要高。测验的信度与项须要高。测验的信度与项目的区分度有着密切的关目的区分度有着密切的关系,事实上,由试

114、题的区系,事实上,由试题的区分度还可以估计测验的信分度还可以估计测验的信度。整个测验中各试题的度。整个测验中各试题的区分度值的平均数越高,区分度值的平均数越高,测验的信度就越高。值的测验的信度就越高。值的平均数与信度的关系如右平均数与信度的关系如右表。表。试题区分度的评价标准以上标准仅作参考,不是绝对的。事实上,项目区分度的要求以上标准仅作参考,不是绝对的。事实上,项目区分度的要求应根据测验目的而定,若测验目的在于选人,主要评判被试的个别应根据测验目的而定,若测验目的在于选人,主要评判被试的个别差异,那么区分度要求高些;若测验只是考察被试对所学知识的掌差异,那么区分度要求高些;若测验只是考察被

115、试对所学知识的掌握情况,可不过多考虑区分度。握情况,可不过多考虑区分度。应用举例:作答反应分析n目的:对教与学过程中可能存在的问题进行诊断。n内容:选择题中不同选项被选频数的分析;学生集中出现的错误反应及其原因等。示例:题号组别组别选答人数选答人数难度度P区分度区分度DABCD未答未答1H5314300.480.5L121013712H14165800.160.05L1515760n正常正常:H组选择正确答案最多,其他均匀分布n异常异常:H、L组对不正确答案选择过多表明题目或教学存在疏失;H、L组对正确答案选择很接近说明题目缺乏鉴别力。练习八练习八(教材(教材P253-255,T3、4)n1、

116、现对20名学生进行期末测验,结果见右表所示,为了考查第1题是否有区分能力,将该题用二分法记分,答对记1分,答错记0分。试计算该题的区分度。练习八练习八(教材(教材P253-255,T3、4)n2、有15名学生的数学成绩与第2题得分见右表所示,试计算该题的区分度。D=0.6875第九讲测验的编制与实施n题目类型及其测量功能选择题填空题判断题简答题论述题n标准化测验编制的一般程序n教师自编测验判断题n其模式是提供一个陈述句,让考生判断是非、正误,故亦称是非题或正误题。其功能是考察考生对基础知识是否明了是否掌握扎实,适用于考察基础知识层次的内容,不适用于考察推理和判断能力。判断题受随机猜测影响大,猜

117、测答对的概率达50%,学生得分的偶然性大,所以判断题一般用于低年级。n编制判断题的操作要则:n测题含义必须单一明确,不能有歧义。n答案必须明确,并且是无可争议的。同一题中避免使用两个矛盾的概念。n叙述语言简明、不含混,减少读题干扰。n避免使用暗示性词语。例如:绝不、总是、从来、所有、唯一等绝对说法,常有暗示错误的作用,而“可能”、“通常”等词语有暗示正确的作用,所以这些词要避免使用。n应避免使用否定词,尤其不用双重否定词。n全部答案对与错的比例应大体相等。n测题次序应随机排列,不应有任何规则,n尽量不直录教材原文,不得已用时,措词要重新组织。选择题n优点可以测量学生多种层次的学习结果评分标准统

118、一、客观,有利于提高评阅的速度允许较大的试题容量,可以保障题目的覆盖范围和代表性可根据学生对似真选项的选择情况进行诊断n缺点无法了解被试作答时的思维过程难以考核被试的综合能力具有似真性的干扰选项有时不好编制存在猜中答案的几率选择题n编制原则题干意义完整,问题表述明确题干及选项的语言均应简明,避免滥用否定结构、复杂句式诱答项应具有似真性同一测验中各题目应尽量保持独立,避免相互牵连正确答案不能有明显组型填空题n特点主要用于考察被试对基本知识的记忆和理解能力。受被试猜测影响小,评分较客观。无法测量高级的学习结果。使用过多容易造成被试的死记硬背。n编制原则题意要明确,限定要严密,以保证空白处应填答案的

119、唯一性。题目中空白部分以一处为宜,过多则使题干支离破碎。所有空白处的线段长度应一致,避免产生暗示作用。若答案是数字,应指明单位或数字的精确程度。匹配题n其模式是由若干匹配项与选择项两部分组成。它实际上是复合型的选择题,是由若干个题干共同使用相同的若干选项。其功能是适宜于测量考生对知识的记忆、理解与运用的情况。其形式有:连线式(将一组词句、段落依据规定的顺序排列起来)、归类式(按某一标准把有关选项归入匹配项)等。n编制匹配题的操作要则:n匹配项与选择项不应是一对一的,选择项要多于匹配项,以减少学生猜答的可能性。n允许同一选项多次使用,当然也可以有的选项不被选用,以降低猜对的概率。n连线匹配题,分

120、开两组的各项目的性质必须一致,以增加迷惑性。n选择项一般控制在10项以内,太多会增加学生的心理负担,n正确的答案要随机排列。n一题的所有匹配项与选择项要安排在同一页上,尤其是连线式的,以减少考生答案的麻烦。简答题n特点适合于考察被试对基本知识、概念和原理的掌握、记忆情况。编制简单、灵活。n编制原则问题叙述清楚、明确。答案要简短具体,使被试可以用简洁的语言来回答,避免繁琐的计算和长篇大论。避免只出机械记忆性的题目,应注重知识的应用。论述题n优点可以用来对高层次、复杂学习结果的测量。可以用于各学科领域,特别适用于人文、社会科学领域。可以增进学生的思考、应用及解决问题的能力,对于被试的学习态度和学习

121、方式可以产生积极的影响。如可以促使学生注意教材内容的内在联系和对所学知识进行有机的组织。试题编制相对容易,可以增进被试的写作能力。n缺点论述题一般都是大题,因此在一次考试中试题的取样范围比较小,且分布不均匀,难以做到全面考察。评分的主观性强。即使有参考答案和评分标准,但因被试的回答自由,回答问题的方向也不尽相同,评分的主观性仍难以避免。被试作答和评分阅卷均较为费时。论述题n编制原则试题应该用来测量较高层次的学习目标(如分析、综合、评价),特别是那些小型客观题不易测量的学业成就。如要求学生陈述理由、解释变量间关系,描述与评价资料、推理证明等。要明确而系统地陈述问题,使被试能清楚地了解题目的要求。

122、使每道题都能真实地反映被试实际能力而不受阅读理解等其他因素干扰。不同的论述题之间很难做到等值,因此一般不要让被试选择问题回答,否则不同被试的得分难以比较。操作题n操作题是测量考生实际能力的新题型。如社会科学的朗诵、演讲、主持节目,艺术科学的表演(如弹、唱,小品),自然科学的实验、安装、演示、计算机操作等技能技巧的测量。其局限是:题目同质困难,评分不易客观,n编制操作题的操作要则:n应以测量本学科基本知识基本技能的实际应用能力为内容。n测题应是同质同级、难易相仿的,以保证评分的公平性。n测题内容覆盖面要宽,数量要多,由考生随机抽取。n一个测题只能由一个考生来做,不能一个题目先后由几个考生来做。n

123、操作的内容、形式、完成时间要有明确交代。n要准备好操作所必需的材料。编制测验的一般步骤1、确定测验目的2、分析教育目标(编制双向细目表的一般步骤)3、测验取材并编拟题(遵循的要求)4、试测与分析(项目分析的步骤)5、编制测验教育目标分类学n布卢姆将教育目标分为认知、情感、动作技能三个领域,每个领域分为若干层次,其中认知领域分为知识、理解、应用、分析综合、评价六个层次。这种分类突出了基础知识、能力发展和实际操作技能,适用于于学科测验的编制,一般是依据它编拟双向细目表。n制定双向细目表是编制测验的重要环节,它说明了测验的内容,测验目标及其水平,以及它们在整个测验中所占的比重,它是确定测验题目的内容

124、、覆盖面、数量以及分数分配等的重要依据。编制双向细目表的一般步骤n1、按照各级教学目标的试题在整份试卷中的一般比例和学生的实际水平进行横向设计。n2、根据知识内容的重要性和综合性程度进行纵向设计。n3、根据纵横向双向比例把实际得分点分配到中间每个格子中去测验取材遵循的要求n1、测验取材要有目的性n2、测验取材要有代表性n3、测验取材要有普遍性n4、测验取材要有鉴别性项目分析的步骤n1、选取有代表性的样本若干人,按规定的程序进行预测。n2、把这些人的测验总分按高低排列,然后取出高分组和低分组n3、计算高分组和低分组通过每一题目的比率或得分情况n4、按照公式分别求出第个题目睥难度和区分度。n5、比

125、较高分组、低分组在项目答案上不同的反应;n6、根据项目统计分析结果,修改或选择项目。教师自编测验n教师自编测验的特点形式灵活、简易快速内容紧扣大纲及教学内容难度适合学生实际水平n用科学原理指导测验编制工作深入研究教材、深入了解学生制定恰当的合格标准合理使用各种题型注意总结经验、提高命题技术控制评分误差,防止简单粗糙复习思考题复习思考题选选择择题题1.下表中的数据最好用哪种统计图来呈现?(下表中的数据最好用哪种统计图来呈现?()表表1某中学毕业班近某中学毕业班近10年来升入高中的学生数年来升入高中的学生数1990199119921993199419951996199719981999人数人数15

126、7164170162178189211218230250A.直方图直方图(连续型变量的频数分布图)连续型变量的频数分布图)B.直条图直条图(离散型变量的频数分布图)(离散型变量的频数分布图)C.多边图多边图(连续型变量的频数分布图)(连续型变量的频数分布图)D.散点图散点图(离散型变量的分布图(离散型变量的分布图)B2.下列分布中哪一种是单峰对称分布?下列分布中哪一种是单峰对称分布?()A.A.F F分布分布 B.B.2 2分分布布 C. C. t t分布分布 D.D. 二项二项分布分布C3.当一组数据用中位数来反映集中趋势时,这组数当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量

127、来表示离散程度?据最好用哪种统计量来表示离散程度?()A.A.全距全距 ( (差异量)差异量)B.B.四分位距(差异量)四分位距(差异量)C.C.方差(差异量)方差(差异量)D.D.标准差(差异量)标准差(差异量)B4.总体不呈正态分布,从该总体中随机抽总体不呈正态分布,从该总体中随机抽取容量为取容量为10001000的一切可能样本的平均数的一切可能样本的平均数的分布接近于:的分布接近于:()A.A.二项分布二项分布B.B.F F分布分布C.C.t t分布分布D.D.正态分布正态分布D5.下列说法中哪一个是正确的?下列说法中哪一个是正确的?()A.A.若若r r1 1=0.40=0.40,r

128、r2 2=0.20=0.20,那么那么r r1 1就是就是r r2 2的的2 2倍;倍;B.B.如果如果r=0.80r=0.80,那么就表明两个变量之间那么就表明两个变量之间的关联程度达到的关联程度达到80%80%;C.C.相关系数不可能是相关系数不可能是2 2;D.D.相关系数不可能是相关系数不可能是-1-1。C6.当两列变量均为二分变量时,应计算哪一种相关当两列变量均为二分变量时,应计算哪一种相关?()A.A.积差相关积差相关B.B.相关相关 C.C.点二列相关点二列相关 D.D.二列相关二列相关B7、如果两个行为变量的观测值皆为顺序变量,则、如果两个行为变量的观测值皆为顺序变量,则研究这

129、两个变量之间的相关系数时,宜采用研究这两个变量之间的相关系数时,宜采用()A、等级相关系数、等级相关系数B、积差相关系数、积差相关系数C、点双列相关系数、点双列相关系数D、双列相关系数、双列相关系数An8、观测数据为、观测数据为90,90,86,83,80,80,75,70;则这组数据的全距为(;则这组数据的全距为()nA、98B、18C、25D、20n9、一批数据的离差之和为(、一批数据的离差之和为()。)。nA、难以确定、难以确定B、1C、0D、大于、大于0n10、一批数据,其离差平方和的平均数称为(、一批数据,其离差平方和的平均数称为()nA、平均差、平均差B、标准差、标准差C、方差、方

130、差D、变差、变差DCCn11、复本信度和重测信度这两种方法的最大差别是(、复本信度和重测信度这两种方法的最大差别是()。)。nA、不是同一批被试、不是同一批被试B、计算误差大小、计算误差大小nC、不是同一份测验、不是同一份测验D、计算方法、计算方法n12、集中量数反映一批数据的(、集中量数反映一批数据的()nA、平均数、平均数B、差异程度、差异程度C、集中趋势、集中趋势D、离中趋势、离中趋势n13、如果某行为变量、如果某行为变量X和变量和变量Y之间存在统计相关关系,之间存在统计相关关系,则说明(则说明()nA、X是是Y变化的原因变化的原因B、X是是Y变化的结果变化的结果nC、X和和Y的变化互为

131、因果的变化互为因果D、X与与Y的变化有某种关联的变化有某种关联CCDn14、标准正态分布的平均数和标准差分别是(、标准正态分布的平均数和标准差分别是()nA、0和和1B、-3和和+3nC、-1和和1D、-4和和+4n15、按测验材料来分,可把测验分成(、按测验材料来分,可把测验分成()。)。nA、语文测验和数学测验、语文测验和数学测验B、语言测验和操作测验、语言测验和操作测验nC、文字测验和非文字测验、文字测验和非文字测验D、个别测验和团体测验、个别测验和团体测验ACn16、学生的英语测验成绩属于()nA.名义变量B.顺序变量nC.等距变量D.比率变量n17、常用于描述离散性随机变量统计事项的

132、统计图是()nA.条形图B.次数直方图nC.次数多边图D.散点图BAn18、下列统计量中对数据变化灵敏性最差的是、下列统计量中对数据变化灵敏性最差的是()nA.方差方差B.平均差平均差C.算术平均数算术平均数D.中位数中位数n19、下列统计量中不适于作进一步代数运算的是、下列统计量中不适于作进一步代数运算的是()nA.算术平均数算术平均数B.加权平均数加权平均数nC.平均差平均差D.标准差标准差n20、某城市调查、某城市调查8岁儿童的身高情况,所用单位为厘米,岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数根据这批数据计算得出的差异系数()nA.单位是厘米单位是厘米B.单位是米

133、单位是米nC.单位是平方厘米单位是平方厘米D.无单位无单位DCDn21、下列相关系数中表示两列变量间的相关强度最小的是()nA.0.90B.0.10C.-0.40D.-0.70n22、下列几种效度中,不具有效度真正意义的是()nA.结构效度B.内容效度nC.表面效度D.效标关联效度n23、选择题的主要缺点是()nA.编题难度较大B.评分主观nC.测量的学习内容范围较窄D.保密性差BCAn23、任何一个随机事件发生的概率的取值区间是、任何一个随机事件发生的概率的取值区间是()nA.0p1B.0P1nC.0P1D.-1P1n24、随机抽样的原则是、随机抽样的原则是()nA.总体内个体相互独立总体内

134、个体相互独立B.总体内个体相互关联总体内个体相互关联nC.总体应较大总体应较大D.样本应较大样本应较大n25、下列关于、下列关于t分布的论述,不正确的是分布的论述,不正确的是()nA.t分布是随着自由度的变化而变化的一簇曲线分布是随着自由度的变化而变化的一簇曲线nB.t分布是对称的分布分布是对称的分布nC.自由度越小,自由度越小,t分布与正态分布差别越明显分布与正态分布差别越明显nD.在自由度较小时,在自由度较小时,t分布是偏态分布分布是偏态分布CADn24、一组数据的平均数为X,标准差为S。若在每个分数上都加上一个常数C,则新的平均数和标准差为()。X,SX+C,SX,S+CX+C,S+Cn

135、25、按照皮尔逊求众数的公式,平均数、中数、众数的关系是()。n众数最大,它跟平均数的差是它跟中数差的三倍。n中数最大,它跟众数的差是它跟平均数差的三倍。n平均数居中,它跟众数的差是它跟中数差的三倍。n中数居中,平均数跟众数的差是它跟中数差的三倍。n26、次数分布的方差变小,曲线图形将()。n向左平移向右平移n变平缓变陡峭n27、随着样本容量n的增大,平均数抽样分布的标准差将()。n不变增大缩小无法确定n28、统计估计是()。n以样本统计量估计总体参数n以样本参数估计总体统计量n以总体参数估计样本统计量n以总体统计量估计样本参数n29、以下关于难度、区分度的表述,错误的是()nP值越小,测验题

136、目越容易,分数分布呈负偏态。nP值越接近0.50,试题的鉴别能力就越高。n当测验用于选拔时,题目的难度值应更多的接近录取率。n整个测验中各试题的区分度D值的平均数越高,测验的信度就越高。n30、下列数据中,哪一个与其它的不同类?()n30人30辆30斤30株n31、从应用的广泛程度来看,集中量数应按下列哪种方式排列?()n中数、众数、算术平均数n众数、中数、算术平均数n中数、算术平均数、众数n算术平均数、中数、众数n32、双变量中,当X值变化,Y值相应地发生变化,即当X值增大(或减小),Y值也随之增大(或减小),二者的相关关系是()n负相关正相关零相关反相关n33、下列题型中,哪一个与其它的不

137、同类?()n简答题选择题论述题匹配题n34、若某同学在学校同龄同学中,身高的标准分为0.45,那么,其高矮情况是()n高于同龄同学的平均身高n低于同龄同学的平均身高n等于同龄同学的平均身高n无法判断n35、区间估计的置信度的含义是()置信区间的自由度n置信区间跟总体参数的相关值n置信区间的误差大小n置信区间包含总体参数的概率n36、教育测量的主要工具是()n测量测验考试实验n37、具有相等单位而没有绝对零点的量表是()n命名量表顺序量表n等距量表比率量表n38、布鲁姆将认知目标分成六个主要类别,即()n知识、理解、运用、语言行为、组织、评价n知识、理解、运用、分析、组织、评价n知识、理解、组织

138、、运用、分析、评价n知识、理解、运用、分析、综合、评价n39、在一测验的某道选择题上,100名被试中,选择正确答案的有36名,则该题的难度为()n0.0363.6n0.360.36%n40、对某一客观性试题进行题目分析,结果是高分组通过率为80%,低分组通过率为20%,则该题的区分度为()n0.800.20n0.400.60是是非非题题n1.如果一个事件的结果事先不能预料,这种事件就称为随机事件。()n2.某同学数学考试的标准分为1.96,这说明全班同学中成绩在他以下的人数百分比为97.5%。()n3.单纯随机抽样比机械抽样的随机性强。()n4.分层随机抽样的原则是使同一层内的差别要小,而使不

139、同层的差别要大。()n5.抽样分布是连接总体与样本的桥梁。()n6.当样本容量N30时,我们称之为大样本;反之,则称之为小样本。()简简答答题题1、在教育测量学中,信度的主要含义是什么、在教育测量学中,信度的主要含义是什么?对教育测量有何意义?对教育测量有何意义?n2、什么是效度?在教育测量中信度和效度哪个、什么是效度?在教育测量中信度和效度哪个更重要?更重要?n3、如何估计学生学业成绩测验的内容效度?、如何估计学生学业成绩测验的内容效度?n4、提高测验、提高测验信度信度和和效度的方法有哪些?效度的方法有哪些?n5、什么叫难度?难度对测验有什么影响?、什么叫难度?难度对测验有什么影响?n6、什

140、么叫项目区分度?项目区分度对测验有什、什么叫项目区分度?项目区分度对测验有什么影响?么影响?n7、如何编制命题的双向细目表?、如何编制命题的双向细目表?计计算算题题1请计算下列数据的平均数和标准差。请计算下列数据的平均数和标准差。9,3,7,5,6,8,7,5,8,9,4,6,5,6,8,7,4,10。解:根据平均数和标准差的计算公式,得:解:根据平均数和标准差的计算公式,得:2请计算下列数据的中位数和标准差。请计算下列数据的中位数和标准差。11,11,11,15,14,13,13,9,17,10,10,10,12,12,12,8,8,9。解:根据中位数的计算方法,先对数据进行从小到大排序:解

141、:根据中位数的计算方法,先对数据进行从小到大排序:8,8,9,9,10,10,10,11,11,11,12,12,12,13,13,14,15,17。Md=(11+11)/2=11根据标准差的计算公式,得:根据标准差的计算公式,得:3请计算下面这组数据的中位数和平均差。请计算下面这组数据的中位数和平均差。7,3,2,9,4,4,7,8,9,5。解:中位数解:中位数=(5+7)/2=6=Md平均差平均差=22/10=2.2分数分数频数频数7075808590952351074解:根据中位数和平均差的计算公式,得:解:根据中位数和平均差的计算公式,得: 4 根根 据据 下下 表表 中中 的的 数数

142、 据据 计计 算算 中中 位位 数数 和和 平平 均均 差差 。5从从赣赣州州市市初初二二年年级级数数学学期期末末考考试试中中随随机机抽抽取取28份份试试卷卷,算算得得平平均均数数为为83.2,标标准准差差为为8.4,请请推推测测全全市市此此次次考考试试平平均均分分的的99的置信区间。的置信区间。解:全市此次测验解:全市此次测验99的置信区间为:的置信区间为:即此次考试全市平均分的即此次考试全市平均分的99的置信上限为的置信上限为87.68,置信,置信下限为下限为78.72。6.从从赣州赣州市初一年级数学测验中随机抽取市初一年级数学测验中随机抽取26份试卷,份试卷,算得平均数为算得平均数为80

143、,标准差为,标准差为5.4,请推测全市此次测验平均请推测全市此次测验平均分分99的置信区间。的置信区间。即此次数学测验全市平均分的即此次数学测验全市平均分的99的置信上限为的置信上限为83.01,置信下限为置信下限为76.99。解:因为解:因为n=2630,所以全市此次测验平均数,所以全市此次测验平均数99%的置的置信区间为:信区间为:n7、有100名学生参加某学科测验,高分组与低分组人数各取总人数的27%,其中第一题高分组答对的有20人,低分组答对的有12人。这道题的难度是多少?n8、有100名考生参加某论文试题的测验,按高低分各占总人数的25%分组,其中第5题得分统计如右表,试计算该题的难度。P=0.593P=0.512n9、现对20名学生进行期末测验,结果见右表所示为了考查第1题是否有区分能力,将该题用二分法记分,答对记1分,答错记0分。试计算该题的区分度。n10、有15名学生的数学成绩与第2题得分见右表所示,试计算该题的区分度。D=0.6875n11、设有14名学生,经过一项测验,成绩如下表:本拟再测一次以估计其信度,由于学生放假离校,不便再测。现拟估计其测验结果的信度。用什么方法估计?测验的信度系数如何?n14名学生某项测验成绩如表rx1x2=0.948,rxx=0.97

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号