《教育数据类别与测量质量指标课件》由会员分享,可在线阅读,更多相关《教育数据类别与测量质量指标课件(76页珍藏版)》请在金锄头文库上搜索。
1、教育统计与测量的基础知识教育统计与测量的基础知识第一节第一节 教育统计基础知识教育统计基础知识一、教育统计与测量概述一、教育统计与测量概述1.什么是统计学什么是统计学 统计学是研究统计原理和方法的统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原以此为依据,对总体特征进行推断的原理和方法。理和方法。(1)数理统计:以概率论为基础,对数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,统计数据数量关系的模式加以解释,对统计原理和方法给予数
2、学的证明。对统计原理和方法给予数学的证明。(2)应用统计:统计原理在某个行业应用统计:统计原理在某个行业的具体应用。如工业统计学、教育的具体应用。如工业统计学、教育统计学等。统计学等。2.统计学分类统计学分类3.教育统计教育统计 教育统计是运用数理统计原理和方教育统计是运用数理统计原理和方法法,研究教育问题的一门应用科学。主要研究教育问题的一门应用科学。主要包括:包括:描述统计;描述统计;推断统计;推断统计;实验设计。实验设计。.教育统计中几个名词教育统计中几个名词n频数频数:随机事件在:随机事件在n次试验中出现次试验中出现的次数,称这个随机事件的频数。的次数,称这个随机事件的频数。n频数分布
3、频数分布:各种随机事件在:各种随机事件在n次试次试验中出现的次数分布,称为频数分验中出现的次数分布,称为频数分布。布。n离差离差:个体量和某一群体的平均:个体量和某一群体的平均量之差。量之差。教育统计中几个名词教育统计中几个名词n正态分布正态分布:是一种连续型随机变量的概率:是一种连续型随机变量的概率分布。分布。n二项式分布中当二项式分布中当 p=q时,且时,且n很大时,二项式分布接近于正态分布很大时,二项式分布接近于正态分布 表2:一个学生做题正误题做对不同题数的概率分布(做对每题的概率p=1/2;做错的概率为1/2)做对题数012345678910出现方式数1104512021025221
4、012045101二、统计表二、统计表n构成:统计表一般由标题、表号、构成:统计表一般由标题、表号、标目、表注等构成。标目、表注等构成。n编制基本原则:结构简明,一目编制基本原则:结构简明,一目了然。了然。l 统计表基本格式统计表基本格式横标目的总标目(亦可空白)纵标目(一般设谓语)横标目数字表的标题?注脚:说明资料来源等 X X X(顶线)(底线)性别成 绩合计优良中差男9137433女489223合计132116656表表1 初三初三(1)(1)班男女生数学成绩分布统计表班男女生数学成绩分布统计表 三三.统计图统计图统计图由标题、图号标目、图注等项构成统计图由标题、图号标目、图注等项构成。
5、1.直条图直条图 2.圆形图圆形图3.线条图线条图4.频数颁布直方图频数颁布直方图图图.4中考化学统计成绩直方图中考化学统计成绩直方图5.累积频数图累积频数图图图.5 2004年中考化学抽样得分情况累积频数图年中考化学抽样得分情况累积频数图 10 20 30 40 50 60 70 80 90 100图2.6:高一语文四、集中量四、集中量1.算术平均数算术平均数()所有观察值总和除以总频数之和所得商。所有观察值总和除以总频数之和所得商。四、集中量四、集中量2.加权平均数加权平均数()n是不同比重数据是不同比重数据(或平均数或平均数)的平均数的平均数n或或.nN表示各组的频数;表示各组的频数;X
6、 表示各组的平均数。表示各组的平均数。n例例1:一个学生某门课期中考试成绩为:一个学生某门课期中考试成绩为72分,期末考试成绩为分,期末考试成绩为86分,而期考试分,而期考试占总成绩的占总成绩的40%,期末占,期末占60%,这个,这个学生的学期总分是多少?学生的学期总分是多少?n例例2:某校初一共有:某校初一共有3个班,某次语文测验中,个班,某次语文测验中,一班一班50人均分为人均分为68,二班,二班45人均分为人均分为75,三,三班班40人均分为人均分为80,问全校初一语文的平均成,问全校初一语文的平均成绩?绩?不能用:(不能用:(68+75+80)/3=74.33正态分布图正态分布图n偏正
7、态分布偏正态分布五、差异量五、差异量1.全距(全距(R)一组数据中最大值和最小值之差表示,又称极一组数据中最大值和最小值之差表示,又称极差。差。2.标准差(标准差(或或S)标标准差概念:准差概念:标标准差是指离差平方和后平均的准差是指离差平方和后平均的方根。方根。问题问题1:某班甲乙两组在一次测验中的某班甲乙两组在一次测验中的成绩分别为成绩分别为65,68,71,72,74(均分为(均分为70分)和分)和 30,50,86,90,94(均分为(均分为70分)。如何评分)。如何评价两组的学习情况?价两组的学习情况?n方法一:根据定义式计算方法一:根据定义式计算n方法二:根据原始数据计算方法二:根
8、据原始数据计算n方法三:利用计算器计算方法三:利用计算器计算n方法四:利用计算机计算方法四:利用计算机计算3.差异系数(变异系数)差异系数(变异系数)n 两个群体测量单位不同,或虽测量两个群体测量单位不同,或虽测量单位相同,平均数相差很大时,不能用单位相同,平均数相差很大时,不能用标准差比较他们离散程度,可利用差异标准差比较他们离散程度,可利用差异系数。系数。n问题问题2:某校期末考试语文平均成绩为:某校期末考试语文平均成绩为69.3分,标准差为分,标准差为11.2分;英语平均成分;英语平均成绩为绩为94.8,标准差为,标准差为13.8分。问哪一学分。问哪一学科离散程度大?科离散程度大?n问题
9、问题3:设某考区已录取高中学生语文平:设某考区已录取高中学生语文平均分为均分为69分,标准差为分,标准差为12.5分,而未录分,而未录取高中的学生语文平均分为取高中的学生语文平均分为40分,标准分,标准差为差为12.5分。比较他们语文成绩的离散分。比较他们语文成绩的离散程度。程度。CV1=12.5/69*100%=18.12%;CV2=12.5/40*100%=31.25%。未录取学生的离散程度大。未录取学生的离散程度大。n问题问题4:下表中是某班甲乙两同学的期末:下表中是某班甲乙两同学的期末考试成绩,问:(考试成绩,问:(1)甲同学的语文和数)甲同学的语文和数学哪科相对较好?学哪科相对较好?
10、(2)甲同学和乙同)甲同学和乙同学相比,哪一个学业成绩较好?学相比,哪一个学业成绩较好?甲 生乙 生项目项目个人个人成绩成绩所在班级所在班级平均成绩平均成绩标准差标准差Z Z个人个人成绩成绩所在班级所在班级平均成绩平均成绩标准差标准差Z Z语文语文737348.348.313.913.91.81.8626248.348.313.913.91.21.2数学数学797966.966.918.518.50.70.7858566.966.918.518.50.80.8英语英语757567.267.214140.60.6808067.267.214140.90.9合计合计227227227227六、标准
11、分六、标准分(1)概念:标准分是将原始分数(测验分)概念:标准分是将原始分数(测验分数)与平均分数相减,再除以标准差所数)与平均分数相减,再除以标准差所得的商。得的商。甲同学:甲同学:z(语文)(语文)=(73-48.3)/3.9=1.8 z(数学)(数学)=(79-66.9)/18.5=0.7(2)标准分特点)标准分特点n标准分是以标准差为单位的,故称为标标准分是以标准差为单位的,故称为标准分。它是一种相对地位分。准分。它是一种相对地位分。n标准分有正负之分,一般在标准分有正负之分,一般在-3,3中中(几率为(几率为99.74%),平均值为零。,平均值为零。n标准分可比性根据在于标准正态分布
12、。标准分可比性根据在于标准正态分布。T分数:分数:T=100Z+500 (一般一般200T800)(3)标准分应用)标准分应用n比较各个学生成绩在班级中地位;比较各个学生成绩在班级中地位;n比较某个学生两科或多科测验中所得分比较某个学生两科或多科测验中所得分的优劣,精确地计算学生的总成绩。的优劣,精确地计算学生的总成绩。n确定等级评定的人数。确定等级评定的人数。七、相关系数七、相关系数n相关:是指两个或两个以上变量之间存相关:是指两个或两个以上变量之间存在相互依存关系。如数学课成绩与数学在相互依存关系。如数学课成绩与数学竞赛成绩、数学与物理成绩等。竞赛成绩、数学与物理成绩等。n正相关正相关n负
13、相关负相关n零相关零相关n相关系数相关系数:用来描述两个变量相互用来描述两个变量相互之间变化方向及密切程度的数字特征之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相量称为相关系数。最常用的是积差相关系数。关系数。数学与物理、物理与英语相关性比较数学与物理、物理与英语相关性比较数学物理英语物理170757675260636063382756575444605660552557055690978597780894889r0.91 0.26 相关系数与相关程度表一览表表相关系数与相关程度表一览表表|r|00.30.3|r|0.50.50.81.0 相关程度零相关微相关切实相关密切相关
14、高度相关完全相关 八、差异显著性检验八、差异显著性检验假设检验的基本原理假设检验的基本原理 1.1.假设假设n虚无假设(零假设):是关于当前样本所属的虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别总体(指参数)与假设总体(指参数)无区别的假设,一般的假设,一般H0表示。表示。n备择假设(研究假设):是关于当前样本所属备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的总体(指参数)与假设总体(指参数)相反的假设,一般用的假设,一般用H1表示。表示。u由于直接检验备择假设的真实性困难,假设检由于直接检验备择假设的真实性困难,假设检验
15、一般都是从虚无假设出发,通过虚无假设的验一般都是从虚无假设出发,通过虚无假设的不真实性来证明备假设的真实性。不真实性来证明备假设的真实性。八、差异显著性检验八、差异显著性检验n2.小概率事小概率事 在随机事件中,概率很小的事件被在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在称为小概率事件,习惯上约定在0.05以以下,即当下,即当P(A)1.96.0 1.96,则,则0.050.05,拒绝零假,拒绝零假设。实验班和对照的化学成绩存在显著差异设。实验班和对照的化学成绩存在显著差异双侧检验统计决断规则双侧检验统计决断规则|与临界值比较值检验结果|1.96P0.05保留,拒绝1.96|2.
16、580.01P 0.05在0.05显著水平上拒绝,接受。|2.58P0.01在0.0显著水平上拒绝,接受。第二节第二节 教育测量的质量特性教育测量的质量特性n一个高质量的测验,它的结果是可靠而一个高质量的测验,它的结果是可靠而且是有效的;且是有效的;n可靠性(信度)和有效性(效度)是评可靠性(信度)和有效性(效度)是评价测验质量的两个重要指标。价测验质量的两个重要指标。一、教育测量的信度和效度一、教育测量的信度和效度n当一个测验多次测量的结果一致时,它当一个测验多次测量的结果一致时,它就被认为是可靠的;就被认为是可靠的;n估计测量一致性程度的指标被称为信度。估计测量一致性程度的指标被称为信度。n如果在大体相同的条件下,几次测验都得到了大体相如果在大体相同的条件下,几次测验都得到了大体相同的分数,那么这个测验的信度是较高的,反之,信同的分数,那么这个测验的信度是较高的,反之,信度就低;度就低;n即如果被试的实得分数与真实分数差距小,则测验的即如果被试的实得分数与真实分数差距小,则测验的分数越可靠,信度越高。分数越可靠,信度越高。n通常用信度系数衡量测验好坏:通常用信度系数衡量测验好坏:n