《教育统计学》PPT课件

上传人:pu****.1 文档编号:588460394 上传时间:2024-09-08 格式:PPT 页数:142 大小:1.38MB
返回 下载 相关 举报
《教育统计学》PPT课件_第1页
第1页 / 共142页
《教育统计学》PPT课件_第2页
第2页 / 共142页
《教育统计学》PPT课件_第3页
第3页 / 共142页
《教育统计学》PPT课件_第4页
第4页 / 共142页
《教育统计学》PPT课件_第5页
第5页 / 共142页
点击查看更多>>
资源描述

《《教育统计学》PPT课件》由会员分享,可在线阅读,更多相关《《教育统计学》PPT课件(142页珍藏版)》请在金锄头文库上搜索。

1、教育测量与评价教育测量与评价教材:华东师范大学王孝玲编著课时数:6472课时,3-4学分。章节数:共十五章,三大部分描述统计,推断统计,抽样设计教育统计学教育统计学 695013两个理论基础n“凡物的存在必有其数量” (美国心理学家桑代克18751949)n“凡有数量的东西都可以测量” (美国测量学者麦柯尔)复杂的因果关系:复杂的因果关系:随机现象随机现象n在因果关系复杂的条件下在因果关系复杂的条件下n无法根据已知的有限原因精确地预测结果无法根据已知的有限原因精确地预测结果n因为即使在已知条件相同的情况下,每一因为即使在已知条件相同的情况下,每一次预测也都是有偏差的次预测也都是有偏差的n随机现

2、象随机现象n学生成绩学生成绩n心理测验得分心理测验得分n候车人数候车人数n作物产量作物产量n产品质量产品质量n收入支出收入支出n等等等等随机现象随机现象n在一定的条件下,可能出现也可能不出现,可在一定的条件下,可能出现也可能不出现,可能这样出现,也可能那样出现的一类现象。能这样出现,也可能那样出现的一类现象。n特征:条件不能完全决定结果。特征:条件不能完全决定结果。n研究内容:出现的可能性有多大,不出现的可研究内容:出现的可能性有多大,不出现的可能性有多大,能性有多大,n或者这样出现的可能性有多大,那样出现的可或者这样出现的可能性有多大,那样出现的可能性有多大。能性有多大。 数量差异性与数量规

3、律性数量差异性与数量规律性n数量差异性:一定条件下,出现可能数量差异性:一定条件下,出现可能不一样;不一样;n数量规律性:通过大量试验和观察,数量规律性:通过大量试验和观察,总结出随机现象的规律。总结出随机现象的规律。n数量规律性:平均数;方差、标准差;数量规律性:平均数;方差、标准差;比率、百分比;相关系数等。比率、百分比;相关系数等。n非数量规律性:数量分布非数量规律性:数量分布二、统计学和教育统计学n统计学就是研究随机现象的数量规律性的一门统计学就是研究随机现象的数量规律性的一门数学分支。数学分支。1、统计学含义:Statistics原意是国力、国势定义定义1:统计学是研究统计原理和方法

4、的科学。:统计学是研究统计原理和方法的科学。P1定义定义2:统计学是研究如何搜集、整理、分析反映事:统计学是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。征进行推断的原理和方法。研究什么(对象)、怎么做?干什么(目的)研究什么(对象)、怎么做?干什么(目的) “研究研究搜集、整理、分析搜集、整理、分析数字资料数字资料推断推断“总体特征总体特征”原理和方法原理和方法部分推断全体部分推断全体2、教育统计学的含义:教育统计学是运用数理统计的原理和方式研究教育统计学是运用数理统计的原理和方式研究教育问题的一

5、门应用科学。教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。的客观规律。(教育与心理统计学)三、统计学与教育统计学的内容数理统计学1.统计学教育统计学应用统计学农业统计学人口统计学2.统计学或教育统计学具体内容:三、统计学与教育统计学的内容统教统教计育计育学统学统或计或计学学描述统计描述统计推断统计推断统计实验设计实验设计统计图表统计图表集中量数集中量数

6、差异量数差异量数相关分析相关分析统计估计统计估计假设检验假设检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数检验参数检验非参数检验非参数检验样本选择与分配样本选择与分配实验误差分析实验误差分析因子分析因子分析方差分析方差分析回归分析回归分析抽样设计抽样设计三、统计学与教育统计学的内容1、描述统计(、描述统计(descriptive statistics):对已获:对已获得的数据进行整理、概括,显现其分布特征的统计得的数据进行整理、概括,显现其分布特征的统计方法。方法。P2 (主要是对样本数据的处理主要是对样本数据的处理)2、推断统计、推断统计(inferential s

7、tatistics ):根据样:根据样本所提供的信息,运用概率的理论进行分析、论证,本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测在一定可靠程度上对总体分布特征进行估计、推测的统计方法。(的统计方法。(在一定风险下,在一定风险下,部分推断全体部分推断全体) 3、实验设计、实验设计(experimental statistics ):为提:为提示实验中自变量与因变量的关系,在实验之前所制示实验中自变量与因变量的关系,在实验之前所制订的实验计划。订的实验计划。2.随机现象,随机事件,随机变量。统计处理的变量都是随机变量。五、统计学中几个基本概念3.个体(

8、Case )、总体(Population)与样本(Sample)总体无限总体与有限总体;表示数目样本大样本(n30)与小样本(n30)总体与样本是相对的4.统计量( Statistic )与参数(Parameter)统计量:样本上的数字特征;参数:总体上的各种数字特征。总体总体样本样本统计量统计量描述统计描述统计作出推断作出推断随机抽样随机抽样描述描述总体总体Population.样本样本Sample个体个体Case变量变量Vari.XNxnxi容量容量SizeNni结果结果Value参数Parameter统计量Statistic数据Data统计方法统计方法Stat.推断统计Inf.Stat.

9、描述统计Des.Stat.计数Count总体、样本与个体总体、样本与个体一、统计数据来源来源数据数据种类种类特性:特性:统计分类统计分类经常性资料经常性资料专题性资料专题性资料:报表:报表教育调查教育调查教育实验教育实验:二分法和四分法二分法和四分法变异性、规律性变异性、规律性1 1、按数据观测方法和来源:、按数据观测方法和来源:数据种类(数据的水平)二分法二分法点计数据(点计数据(计数数据计数数据)度量数据(度量数据(测量数据测量数据)2、按数学属性:、按数学属性:间断数据(离散、不连续)间断数据(离散、不连续)连续数据(连续数据(连续型随机变量连续型随机变量)(百分制的分数理论上讲是间断的

10、,但由于(百分制的分数理论上讲是间断的,但由于数据密度大较多,实际处理时归入连续型数据数据密度大较多,实际处理时归入连续型数据处理,连续型数据处理较方便,类似以后也有,处理,连续型数据处理较方便,类似以后也有,总体比率用正态分布处理。)总体比率用正态分布处理。)间断型随机变量间断型随机变量n取值个数有限的数据取值个数有限的数据n人数人数n个数个数n名次名次n五分制得分五分制得分连续型随机变量连续型随机变量n取值个数无限的数据取值个数无限的数据n身高身高n体重体重n智商智商n时间长短时间长短n百分制得分百分制得分问题:为什么要进行数据分类?问题:为什么要进行数据分类? 数据有不同属性(可分);数

11、据有不同属性(可分);不同类型数据用不同统计方法处理。不同类型数据用不同统计方法处理。1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。数据种类(数据的水平)四分法四分法3、按数据测量水平按数据测量水平称名数据称名数据等级(顺序)数据等级(顺序)数据等距数据等距数据等比数据(比率数据)等比数据(比率数据)(标题标题、表号、标目标目、线条线条、数字数字、表注)六部分;(标题标题、图号、标目标目、图形图形、图注)五个方面。简单表、分组表(1个标志)、复合表(2个及以上标志直条图(条形图)、圆形图、线形图、频数分布图多变量图:散点图、雷

12、达图、脸谱图等二、统计表、统计图n例1.小教本011(30名)教育统计学单元考试成绩58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。频数分布表制作步骤频数分布表制作步骤58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。n一般不少于一般不少于5组,也不要超过组,也不要超过15组。组。n组距指的是每一个组内包含的距离(用组距指的是每一个

13、组内包含的距离(用i表示)表示)n斯特奇斯(斯特奇斯(H.A. Sturges)根据经验公式:)根据经验公式: 本例为,将组距调节为本例为,将组距调节为1010,即每,即每1010分为一个组。组数:,分为一个组。组数:,应该分应该分5 5组。组。1)求全距求全距R: 全距指的是全部观察值中最大值与最小值之差。R=xmax- xmin=10058=42。2)决定组数决定组数k和组距和组距i。KR/i频数分布表制作步骤频数分布表制作步骤3)决定组限决定组限n组限就是每一组的起点值和终点值。组限就是每一组的起点值和终点值。4)登记频数登记频数小教本小教本011011教育统计学单元考试学生成绩频数、累

14、积频数分布表教育统计学单元考试学生成绩频数、累积频数分布表分数5060708090合计组中值5565758595频数14551530累积频数15101530小教本小教本011011教育统计学单元考试学生成绩频数分布直方图教育统计学单元考试学生成绩频数分布直方图第三章常用的特征量1.集中量:平均数、中位数、众数;百分位数集中量:平均数、中位数、众数;百分位数2.差异量:全距、四分位距、平均差、方差差异量:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。和标准差、差异系数;百分位距。3.地位量:4.相关量:5.分布形态量:偏态量、峰态量。集中量集中量集中量是代表一组数据典型水平或集中趋集

15、中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一势的量。它能反映频数分布中大量数据向某一点集中的情况。点集中的情况。集中量包括算术平均数、加权平均数、几集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。何平均数、调和平均数、中位数、众数等。算术平均数算术平均数算算术术平平均均数数是是所所有有观观察察值值的的总总和和除除以以总总频数所得之商,简称为平均数或均数。频数所得之商,简称为平均数或均数。样本平均数样本平均数总体平均数总体平均数算术平均数的优点算术平均数的优点n反应灵敏;反应灵敏;n严密确定,简明易懂,计算方便;严密确定,简明易懂,计算方便

16、;n适合代数运算;适合代数运算;n受抽样变动的影响较小;受抽样变动的影响较小;n样本算术平均数是总体平均数的最好估样本算术平均数是总体平均数的最好估计值计值算术平均数的缺点算术平均数的缺点n易受两极端数值(极大或极小)的影响;易受两极端数值(极大或极小)的影响;n一一组组数数据据中中某某个个数数值值的的大大小小不不够够确确切切时时就无法计算其算术平均数。就无法计算其算术平均数。这种这种“两极端数值两极端数值”存在的问题,存在的问题,可用什可用什么办法解决?么办法解决?中位数中位数(Md)中中位位数数是是位位于于依依一一定定顺顺序序排排列列的的一一组组数数据据中中央央位位置置的的数数值值,在在这

17、这一一数数值值上上、下各有一半频数分布下各有一半频数分布着。着。中位数的原始数值计算方法:中位数的原始数值计算方法:单数:单数:121415151718202324:17双数:双数:12141515中位数的应用及其优缺点中位数的应用及其优缺点中中位位数数虽虽然然也也具具备备一一个个良良好好的的集集中中量量所所应应具具备备的的某某些些条条件件,例例如如比比较较严严格格确确定定、简简明明易易懂懂,计计算算简简便便,受受抽抽样样变变动动影影响响较较小小,但但是是它它不不适适合合进进一一步步的的代代数运算数运算。它适用于以下几种情况:。它适用于以下几种情况:(1)一组数据中有特大或特小两极端数值时;)

18、一组数据中有特大或特小两极端数值时;(2)一组数据中有个别数据不确切时;)一组数据中有个别数据不确切时;(3)资料属于)资料属于等级等级性质时。性质时。众数众数(Mo)n众数是集中量的一种指标。众数是集中量的一种指标。n对对众众数数有有理理论论众众数数及及粗粗略略众众数数两两种种定定义义方法方法n理理论论众众数数是是指指与与频频数数分分布布曲曲线线最最高高点点相相对对应应的横坐标上的一点。的横坐标上的一点。n粗粗略略众众数数是是指指一一组组数数据据中中频频数数出出现现最最多多的的那那个数。个数。众数的优缺点众数的优缺点众众数数虽虽然然简简明明易易懂懂,但但是是它它并并不不具具备备一一个个良良好

19、好的的集集中中量量的的基基本本条条件件。它它主主要在以下情况下使用:要在以下情况下使用:n当当需需要要快快速速而而粗粗略略地地找找出出一一组组数数据据的的代代表值时;表值时;n当当需需要要利利用用算算术术平平均均数数、中中位位数数和和众众数数三者关系来粗略判断频数分布的形态时;三者关系来粗略判断频数分布的形态时;n利利用用众众数数帮帮助助分分析析解解释释一一组组频频数数分分布布是是否确实具有两个频数最多的集中点时。否确实具有两个频数最多的集中点时。正态正偏态负偏态P34加权平均数加权平均数加权平均数是不同比重数据(或平加权平均数是不同比重数据(或平均数)的平均数。计算公式为:均数)的平均数。计

20、算公式为:二、差异量二、差异量1.1.差异量:表示一组数据变异程度或离散程度的量。差异量:表示一组数据变异程度或离散程度的量。2.类型:全距、四分位距、平均差、方差和标准差、类型:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。差异系数;百分位距。注:差异量越大表明数据越参差不齐,分布范围越广。注:差异量越大表明数据越参差不齐,分布范围越广。二、差异量二、差异量1、全距(Range):R=xmax-xmin例110、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。(16)3、百分位距PD:P93P7P90P104、平均差:5、方差和标准差:2

21、、四分位距QD(Q3Q1)/2=99-10=89二、差异量二、差异量例110、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。5、方差和标准差:计算方法:1)原始数据法;2)计算工具法;3)其他1)原始数据法:3)计算工具法:4)数学软件:spss等2)频数分布表计算法:问题讨论:一组数据的标准差,大好呢?还是小好?问题讨论:一组数据的标准差,大好呢?还是小好?二、差异量二、差异量6、相对差异量:差异系数、相对差异量:差异系数用途:用途:1)比较不同单位资料的差异程度(单位不同)比较不同单位资料的差异程度(单位不同)2)比较单位相同而平均数相差较大(对

22、象不同)比较单位相同而平均数相差较大(对象不同)3)判断特殊差异情况)判断特殊差异情况正常范围:正常范围:5%CV35%不不正正常:常:CV35%平均数无意义平均数无意义CV5%数值计算正确性数值计算正确性应用应用1)非零点;)非零点;条件:条件:2)等比量表。)等比量表。三、分布形态量三、分布形态量偏态量与峰态量1、偏态量SK0:分布对称SK0:偏态SK0:正偏SK0:负偏2、峰态量Ku:正态峰:非正态Ku0.263:低阔峰Ku0.263:高狭峰偏态量偏态量负偏正偏第五章概率及概率分布n概率的一般概念n概率分布:离散分布与连续分布二项分布与正态分布n正态曲线的面积与纵线n正态分布在测量上的应

23、用概率概率(probability)(probability)的一般概念的一般概念一、概率的定义二、概率的性质0P(A)1P(A)0:不可能事件P(A)1:必然事件三、概率的加法和乘法三、概率的加法和乘法小概率事件A:小概率原理:小概率事件在一次试验中,几乎不可小概率事件在一次试验中,几乎不可能发生。能发生。二项分布(二项分布(bionimal distribution)bionimal distribution)二、二项分布函数二、二项分布函数在在n次试验中成功事件次试验中成功事件P恰好出现恰好出现x次的概率次的概率例在男生占例在男生占2/5的学校中随机抽取的学校中随机抽取10个学生,问正好

24、抽个学生,问正好抽到到4个男生的概率是多少?至多抽到个男生的概率是多少?至多抽到2个男生的概率是多少个男生的概率是多少?1 1)是否是二项试验?)是否是二项试验? 2 2)共试验次数?)共试验次数?3 3)所求随机事件出现次数?)所求随机事件出现次数?例在男生占例在男生占2/5的学校中随机抽取的学校中随机抽取10个学生,问个学生,问正好抽到正好抽到4个男生的概率是多少?至多抽到个男生的概率是多少?至多抽到2个男生的个男生的概率是多少?概率是多少?解:解:随机抽取一个学生即随机试验一次,因为试验结随机抽取一个学生即随机试验一次,因为试验结果只有两个果只有两个:“:“男生男生”与与“女生女生”,而

25、且抽到男生,而且抽到男生与抽到女生是没有关系的,故此试验是贝努利试与抽到女生是没有关系的,故此试验是贝努利试验。验。正好抽到正好抽到4 4个男生的概率:个男生的概率:至多抽到至多抽到2 2个男生的概率是:个男生的概率是:二项分布(二项分布(bionimal distribution)bionimal distribution)二项分布(二项分布(bionimal distribution)bionimal distribution)三、二项分布图二项分布的形态:Pq:对称pq:偏态1)当当n时,二项分布时,二项分布正态分布;正态分布;2)当当np5且且nq5时,二项分布开始接近正态分布。时,二

26、项分布开始接近正态分布。二项分布(二项分布(bionimal distribution)bionimal distribution)四、二项分布的平均数和标准差四、二项分布的平均数和标准差当当二项分布开始接近正态分布二项分布开始接近正态分布时,在时,在n次二项试次二项试验中成功事件出现的平均数和标准差是验中成功事件出现的平均数和标准差是:例从我们班中随机抽取例从我们班中随机抽取10名同学,从理论上讲,名同学,从理论上讲,平均应抽到男生多少个?标准差是多少?平均应抽到男生多少个?标准差是多少?五、二项分布的应用五、二项分布的应用1.求求n次二项试验中成功事件出现的概率;次二项试验中成功事件出现的

27、概率;2.判断试验结果的机遇性与真实性的界限(判断试验结果的机遇性与真实性的界限(1的反向)。的反向)。正态分布正态分布的图形特点的图形特点 正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于 对对称的钟形曲线称的钟形曲线. .特点是特点是“两头小,中间大,左右对称两头小,中间大,左右对称”.”. 即,取x=附近值的可能性大,取偏离x=越远的值的可能性越小。正态分布(正态分布(normal distribution)normal distribution)二、正态曲线的面积与纵线二、正态曲线的面积与纵线2.标准正态曲线下的面积及Z值计算:2)查表法A、已知Z值求面积P:a)求P(0zz1

28、)或或P(z-zP(z-z1 1) ) :c)求P(z1zz2):例例1,P(0z1.96)、z0)z1)、P(z-1.96) P(z-1.96) 、 P(z1.96) P(z1.96)例例3,P(1z2)、P(-1z2)P(-1z2) 、 P(-1.96z1.96) P(-1.96z1.96)例某班48人的数学考试成绩分布呈正态分布,其平均分为75分,标准差为10,问理论上说65至85分之间当有多少人?已知:n=48求 P(65x85)P(65x85)分析:由正态分布图, 要求65至85之间的理论人数,即,解:=-1,=-1,查表得:P(-1Z1)P(-1Z1) 2P(0Z1)2P(0Z1)

29、 P(65x85)P(65x85) 4848 P(-1Z1)P(-1Z30:B.小样本n30:例例.从某小学三年级随机抽取从某小学三年级随机抽取17名学生,其阅读能力名学生,其阅读能力的平均得分为,标准差为。试估计该校三年级阅读能的平均得分为,标准差为。试估计该校三年级阅读能力总体平均数力总体平均数95%和和99%置信区间。置信区间。问题问题:在:在1908年年t分布理论提出前,怎分布理论提出前,怎样解决样解决未知的估计问题?未知的估计问题? 总体平均数的估计总体平均数的估计二、正态总体均值二、正态总体均值的区间估计的区间估计一)总体标准差已知:Z估计二)总体标准差二)总体标准差未知:未知:t

30、估计估计总体平均数区间估计一、正态总体标准差一、正态总体标准差 已知已知: Z估计估计三、正态总体标准差三、正态总体标准差 未知未知: t估计估计2.大样本大样本t估计或近似估计或近似Z估计估计假设检验(本章节内容)假设检验(本章节内容)n假设检验的有关概念假设检验的有关概念n假设检验基本思路假设检验基本思路n假设检验基本步骤及二类错误假设检验基本步骤及二类错误n总体平均数假设检验(总体平均数假设检验(某总体平均水平某总体平均水平有无显著变化?有无显著变化?)假设检验假设检验一、假设检验有关概念:1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:Z检验或检验或

31、t检验检验3)选择检验的形式:)选择检验的形式:双侧检验双侧检验或单侧检验或单侧检验4)规定显著性水平:)规定显著性水平:5)统计决断:)统计决断:拒绝拒绝区域区域接受接受区域区域假设检验假设检验例1某班进行比奈智力测验,结果,已知比奈测验的常模,问该班智力水平(不是这一次的测验结果)是否确实与常模水平有差异?n=1001)提出假设:)提出假设:2)选择检验统计量并计算其值:选择检验统计量并计算其值:因为总体标准差因为总体标准差已知,故采用已知,故采用Z检验。所以,检验。所以,3)选择检验的形式:因为没有资料表明,该班智力水平)选择检验的形式:因为没有资料表明,该班智力水平是否高于或低于常模水

32、平,所以采用双侧检验。是否高于或低于常模水平,所以采用双侧检验。4)统计决断:因为Z2即该班智力水平与常模水平,有显著性差异。即该班智力水平与常模水平,有显著性差异。所以0.01p0.05,2.58=Z,Z=1.96Z2所以在显著性水平上接受所以在显著性水平上接受H1,而拒,而拒绝绝H0,*假设检验假设检验例例P10417某市某市7岁男童体重平均数为千克,标准岁男童体重平均数为千克,标准差为千克,某小学差为千克,某小学70名名7岁男童体重平均数为岁男童体重平均数为22.9,问该问该校校7岁男童体重与该市是否一样?岁男童体重与该市是否一样?1)提出假设:)提出假设:2)选择检验统计量并计算其值:

33、)选择检验统计量并计算其值:因为总体标准差因为总体标准差已知,故采用已知,故采用Z检验。所以,检验。所以,3)选择检验的形式:因为没有资料表明,该校)选择检验的形式:因为没有资料表明,该校7岁男童岁男童体重是否高于或低于全市体重是否高于或低于全市7岁男童体重,所以采用双侧检岁男童体重,所以采用双侧检验。验。4)统计决断:因为Z=2.584.88*,即该校7岁男童体重与全市7岁男童体重,有极其显著性差异。所以,p0.01,所以在显著性水平上接受H1,而拒绝H0,假设检验假设检验例2某区初三英语测验平均分数为某区初三英语测验平均分数为8080,该区某校,该区某校2525份试卷的平均分数和标准差分别

34、为份试卷的平均分数和标准差分别为8383和和1010。问该校初。问该校初三英语平均分数与全区是否一样?三英语平均分数与全区是否一样?1)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:因为总体标准差未知,故采用因为总体标准差未知,故采用t检验。所以,检验。所以,3)选择检验的形式:因为没有资料表明,该校初三英语)选择检验的形式:因为没有资料表明,该校初三英语成绩是否高于或低于全区水平,所以用双侧检验成绩是否高于或低于全区水平,所以用双侧检验4)统计决断:)统计决断:因为因为n=25,所以,所以df=n-1=24,查查t表表得得因为因为t=1.470.05,所以接受所以接受H

35、0,而拒绝而拒绝H1。即该校初三英语平均成绩与全区水平没有显著差异。即该校初三英语平均成绩与全区水平没有显著差异。1- - 0.05假设检验假设检验一、假设检验有关概念4.假设检验的一般步骤:5.假设检验的二类错误:假设检验的二类错误:1)第一类错误:)第一类错误:“以真为假以真为假”弃真错误弃真错误2)第二类错误:)第二类错误:“以假为真以假为真”取伪错误取伪错误假设检验是假设检验是概率条件下概率条件下的反证法的反证法在假设检验中,一般都首先控制第一类错误。在假设检验中,一般都首先控制第一类错误。假设检验假设检验二、平均数的显著性检验小结小结1)提出假设:2)选择检验统计量并计算其值:Z检验

36、或t检验3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:正态总体第七章平均数差异的显著性检验1.需要考虑的问题?需要考虑的问题?2.需要知道什么?需要知道什么?3.共同点:显著性差异检验共同点:显著性差异检验4.不同点:两个样本不同点:两个样本n需考虑的问题:需考虑的问题:n两总体是否正态分布;两总体是否正态分布;n两样本是否相关两样本是否相关n两总体方差两总体方差12和和22是否已知;是否已知;如果未知如果未知,则是否则是否12 = 22 ;n两样本为大样本还是小样本。两样本为大样本还是小样本。平均数差异的抽样分布平均数差异的抽样分布一、正态总体相关样本r已知平均数差

37、异的抽样分布平均数差异的抽样分布一、正态总体相关样本r已知1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:Z检验或检验或t检验或检验或3)选择检验的形式:双侧检验或单侧检验)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:)规定显著性水平:5)统计决断:)统计决断:平均数差异显著性检验步骤平均数差异显著性检验步骤n差异显著性检验的主要过程:差异显著性检验的主要过程:1、确定两总体(样本)是否相关;、确定两总体(样本)是否相关;2、根据问题要求,确定检验形式(双侧或单侧);、根据问题要求,确定检验形式(双侧或单侧);3、看总体标准差是否已知;(已知、看总

38、体标准差是否已知;(已知Z检验)检验)4、独立且独立且未知,方差是否齐性;(齐性未知,方差是否齐性;(齐性t、不齐性、不齐性t)5、看是大样本还是小样本;、看是大样本还是小样本;6、判断样本、判断样本Z、t或或t值是否落入小概率区域;值是否落入小概率区域;7、若落入小概率区域,还需确定差异的显著性级别。、若落入小概率区域,还需确定差异的显著性级别。7.2 相关样本平均数差异的显著性检验相关样本平均数差异的显著性检验一、配对组的情况(等组实验)例例1:为了揭示小学二年级的两种识字教学法是否有:为了揭示小学二年级的两种识字教学法是否有显著性差异,根据学生的智力水平、努力程度、识字显著性差异,根据学

39、生的智力水平、努力程度、识字量多少、家庭辅导力量等条件基本相同的原则,将学量多少、家庭辅导力量等条件基本相同的原则,将学生配成生配成10对,然后把每对学生随机地分入实验组和对对,然后把每对学生随机地分入实验组和对照组。实验组施以分散识字法,而对照组施以集中识照组。实验组施以分散识字法,而对照组施以集中识字法,后期统一测验如下表。字法,后期统一测验如下表。(79.571)()()1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:因为相关样本且总体标准差未知,因为相关样本且总体标准差未知,故采用故采用t检验。所以,检验。所以,3)选择检验的形式:因为没有资料可以说

40、明,两种教学)选择检验的形式:因为没有资料可以说明,两种教学方法哪一种效果好,所以采用双侧检验。方法哪一种效果好,所以采用双侧检验。、71和、9.94r=0.704样本均值和标准差:样本均值和标准差:4)统计决断:)统计决断:因为因为n=10,所以,所以df=n-1=9,查查t表表得得因为因为t=3.463.25=t,所以所以p2.262=t,需进一步查需进一步查t,*平均数差异的抽样分布平均数差异的抽样分布二、正态总体独立样本二、正态总体独立样本r=0贝赫兰斯费舍(Fisher)问题,直至1957年柯克兰与柯克斯解决方案最佳。7.4 方差齐性检验方差齐性检验一、F分布由例由例1、2可知,独立

41、样本,总体标准差未知可知,独立样本,总体标准差未知条件下,进行差异显著性检验,首先条件下,进行差异显著性检验,首先首先首先要进行要进行总体方差齐性检验总体方差齐性检验。用总体标准差估计值用总体标准差估计值S总体标准差总体标准差未知下,怎样判断未知下,怎样判断?即只要检验即只要检验无显著性差异即可无显著性差异即可F检验,检验,英国统计学家费舍首创英国统计学家费舍首创第十章第十章2 2检验检验10.12 2分布及分布及2 2检验检验一、一、2 2检验的特点检验的特点2 2检验是根据检验是根据样本频数分布样本频数分布,对,对总体分布总体分布进行进行推断推断的假设检验。的假设检验。2 2检验与测量数据

42、假设检验的区别:检验与测量数据假设检验的区别:测量数据测量数据假设检验假设检验数据属性数据属性总体分布总体分布检验对象检验对象2 2检验检验连续型连续型间断型间断型正态分布正态分布未未知知总体参数总体参数 非总体参数非总体参数10.12 2分布及分布及2 2检验检验一、一、2 2检验的特点检验的特点二、二、2 2检验的统计量检验的统计量三、三、2 2的抽样分布的抽样分布四、四、2 2检验应用检验应用例例1从某大学随机抽取从某大学随机抽取54位老年教师,其中健康状况属位老年教师,其中健康状况属于好的有于好的有15人,中等的有人,中等的有23人,差的有人,差的有16人,问该校老人,问该校老年教师健

43、康状况好、中、差的人数比率是否是年教师健康状况好、中、差的人数比率是否是1:2:1?解:解:1、提出假设、提出假设H0:健康状况好、中、差的人数比率是:健康状况好、中、差的人数比率是1:2:1H1:健康状况好、中、差的人数比率不是:健康状况好、中、差的人数比率不是1:2:12、选择统计量并计算、选择统计量并计算实际频数:实际频数:理论频数:理论频数: ft1=541/4=13.5,ft2=542/4=27,ft3=541/4=13.5。根据零假设,根据零假设,=3、统计决断、统计决断df=k-1=2,查查2值表,值表,2 2=0.05,根据根据2 2 检验统计决断规则,检验统计决断规则,所以在

44、显著水平上保留零假设,拒绝备择假设。所以在显著水平上保留零假设,拒绝备择假设。即该校老年教师的健康状况,好、中、差人数的比率即该校老年教师的健康状况,好、中、差人数的比率是是1:2:1。2检验能解决的问题检验能解决的问题n调查人们对于某社会现象的看法,结果调查人们对于某社会现象的看法,结果如下。问三种态度人数有无显著差异?如下。问三种态度人数有无显著差异?n同质性检验同质性检验赞成赞成不置可否不置可否反对反对110090110220050503100090011002检验能解决的问题检验能解决的问题n表中表中314名学生的考试成绩是否服从正名学生的考试成绩是否服从正态分布?态分布?n数据正态性

45、的检验数据正态性的检验组组别别45-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99次次数数10 18 22 40 46 72 44 28 18 1242检验能解决的问题检验能解决的问题n对对3627名中小学生的心理测验得到如下名中小学生的心理测验得到如下结果(部分),问性格类型与智力水平结果(部分),问性格类型与智力水平之间有无关联?之间有无关联?n相关性(或独立性)检验相关性(或独立性)检验外倾外倾中间中间内倾内倾智力优秀智力优秀364012智力落后智力落后469288第二节单向表的第二节单向表的2检验检验n把实得的点计数据按一种分类

46、标准编制把实得的点计数据按一种分类标准编制成表就是单向表(单因素)成表就是单向表(单因素)赞成赞成不置可否不置可否反对反对10090110二、一个自由度的二、一个自由度的2检验检验n当当df=1,其中只要,其中只要有一个组的理论值有一个组的理论值ft5,就要运用亚茨(,就要运用亚茨(Yates)连续性)连续性校正法校正法:例例.某区中学团员比例为,现从该区某区中学团员比例为,现从该区某中学随机抽取某中学随机抽取20人,其中团员人,其中团员12人,人,问该校团员的比例与全区是否相同?问该校团员的比例与全区是否相同?(答案:)(答案:)ft1=200.8=16ft2=200.2=4实际频数:实际频

47、数:理论频数:理论频数:5且且df=2-1=1,团员团员非团员非团员三、次数分布正态性的三、次数分布正态性的2检验检验P177自由度为自由度为K -3第三节双向表的第三节双向表的2检验检验n在双向表的在双向表的2检验中,如果要判断两种检验中,如果要判断两种分类特征,即两个因素之间是否有依从分类特征,即两个因素之间是否有依从关系,这种检验称为关系,这种检验称为独立性独立性2检验检验。愿意愿意不愿意不愿意未定未定总和总和nr上上18271055中中20192059下下1871136总和总和nc565341150例例1家庭经济情况属于上、中、下的高三毕业生,对家庭经济情况属于上、中、下的高三毕业生,

48、对于是否报考师范大学有三种不同态度(愿意、不愿意、于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师范大未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?学与家庭经济情况是否有关系?解:解:1、提出假设、提出假设H0:学生是否愿意报考师范的态度与家庭经济状况:学生是否愿意报考师范的态度与家庭经济状况无关系无关系H1:学生是否愿意报考师范的态度与家庭经济状况:学生是否愿意报考师范的态度与家庭经济状况有关系有关系例例1家庭经济情况属于上、中、下的高三毕业生,家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿

49、意、不愿对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师意、未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?范大学与家庭经济情况是否有关系?2、选择统计量并计算、选择统计量并计算i=1,2,3j=1,2,3根据零假设及学生对报考师范大学的态度与家庭经根据零假设及学生对报考师范大学的态度与家庭经济状况之间关系的双向表,可计算出相应理论频数。济状况之间关系的双向表,可计算出相应理论频数。愿意愿意不愿意不愿意未定未定总和总和nr上上18(20.53)27(19.43)10(15.03)55中中20(22.03)19(20.85)2

50、0(16.13)59下下18(13.44)7(12.72)11(9.84)36总和总和nc5653411503、统计决断、统计决断df=(r-1)(c-1)查查2 2值表,值表,,0.01P0.05,根据根据2 2检验统计决断规则,检验统计决断规则,所以在显著水平上保留所以在显著水平上保留H1,拒绝,拒绝H0。即学生是否愿意报考师范大学的态度与家庭经济状况即学生是否愿意报考师范大学的态度与家庭经济状况有关系。有关系。=(3-1)(3-1)=4,r=3,c=3*第十一章相关分析n相关意义相关意义n积差相关积差相关n等级相关n质与量的相关n品质相关相关关系1.变量间关系不能用函数关系精确表达2.一

51、个变量的取值不能由另一个变量唯一确定3.当变量x 取某个值时,变量y 的取值可能有几个4.各观测点分布在直线周围 x xy yn相关的概念相关的概念n两个变量之间两个变量之间不精确不精确、不稳定不稳定的的变化关系变化关系称称为相关关系。为相关关系。第一节相关的意义第一节相关的意义n相关的概念相关的概念n两个变量之间两个变量之间不精确不精确、不稳定不稳定的的变化关系变化关系称称为相关关系。为相关关系。分类:分类:正相关、负相关、零相关正相关、负相关、零相关n相关系数相关系数n用来描述两个变量相互之间变化方向及密切用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。一般用程度的数字

52、特征量称为相关系数。一般用 r 表示。表示。1r 1相关系数(取值及其意义)1. r的取值范围的取值范围是是 -1,1 1r 12. |r|=1,为完全相关为完全相关 r =1,为完全正相关,为完全正相关 r =-1,为完全负正相关,为完全负正相关3. r =0,不存在不存在相关相关关系关系4. -1 r0,为负相关为负相关5. 0r 1,为正相关为正相关6. |r|越越趋趋于于1表表示示关关系系越越密密切切;|r|越越趋趋于于0表表示示关关系越不密切系越不密切相关及相关系数的几点说明相关及相关系数的几点说明n相关系数的值,仅仅是一个比值,不等相关系数的值,仅仅是一个比值,不等距,也不是百分比

53、,因此,不能直接作距,也不是百分比,因此,不能直接作加、减、乘、除。加、减、乘、除。,r,r=n如果两个变量之间存在因果关系,则这如果两个变量之间存在因果关系,则这种关系可以用相关关系体现出来。种关系可以用相关关系体现出来。n相关不等于因果:相关系数只能描述两相关不等于因果:相关系数只能描述两个变量之间的变化方向及密切程度,并个变量之间的变化方向及密切程度,并不能揭示二者之间的内在本质联系。不能揭示二者之间的内在本质联系。 样本、总体相关系数(correlation coefficient)1.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称为总体相关系数,记为称为总体

54、相关系数,记为 2.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关系数,记为关系数,记为r第十二章回归分析第十二章回归分析主要内容:主要内容:n一元线性回归一元线性回归n一元线性回归方程的检验一元线性回归方程的检验n一元线性回归方程的应用一元线性回归方程的应用n多元线性回归简介多元线性回归简介变量间的关系:变量间的关系:n相关系数双向关系相关系数双向关系n回归方程单向关系回归方程单向关系什么是回归分析? 从从一一组组样样本本数数据据出出发发,确确定定变变量量之之间的数学关系式;间的数学关系式; 利利用用所所求求的的关关系系式式,由由一一个个变变量量(自自变变量量)来来

55、预预测测或或控控制制另另一一个个特特定定变变量量的的取取值值,并并给给出出这这种种预预测测或或控控制制的的精精确程度。确程度。一元线性回归模型一元线性回归方程一元线性回归方程n回归线拟合的常用原则,就是使各点与回归线拟合的常用原则,就是使各点与该线纵向距离的平方和为最小。该线纵向距离的平方和为最小。x xy y回归线回归线回归线拟合的常用原则,就是使回归线拟合的常用原则,就是使各点与该线各点与该线纵向距离的平方和为最小纵向距离的平方和为最小回归方程回归方程n确定回归线的方程称回归方程。确定回归线的方程称回归方程。由由x估计估计Y由由Y估计估计x由由Y估计估计X估计方程的求法(例题分析)【例例2

56、】根根据据第第十十一一章章例例子子的的数数据据男男青青年年前前臂长臂长y对身高身高x的线性回归方程的线性回归方程回归方程为:回归方程为:y = 4.897+ x第十四章抽样设计(技术)第十四章抽样设计(技术)n统计的质量取决于数据的质量统计的质量取决于数据的质量n推断统计学各种方法运用的前提推断统计学各种方法运用的前提n就是要先获得对总体有足够代表性的样本资就是要先获得对总体有足够代表性的样本资料或实验数据料或实验数据推断可靠性三因素:数据的质量、统计方法及推断可靠性三因素:数据的质量、统计方法及数据处理的准确性、样本对总体的代表性数据处理的准确性、样本对总体的代表性怎样抽?抽多少?第一节抽样

57、调查与抽样方法第一节抽样调查与抽样方法n从总体中抽取部分个体组成样本,对该从总体中抽取部分个体组成样本,对该样本进行观察,进而推断未知总体情况,样本进行观察,进而推断未知总体情况,称为抽样调查。称为抽样调查。n抽样调查分为非概率抽样调查和概率抽抽样调查分为非概率抽样调查和概率抽样调查两大类。样调查两大类。常用的抽样方法常用的抽样方法n简单随机抽样简单随机抽样n分层随机抽样分层随机抽样n机械抽样(系统抽样)机械抽样(系统抽样)n整群抽样和多阶段抽样整群抽样和多阶段抽样简单随机抽样简单随机抽样n从总体的从总体的N个个体中,完全以随机形式个个体中,完全以随机形式(不加人为干扰地)抽取(不加人为干扰地

58、)抽取n个个体组成一个个体组成一个样本。在抽取的过程中,总体中每个个样本。在抽取的过程中,总体中每个个体被抽到的个体被抽到的概率是均等概率是均等的,并且在任的,并且在任何一个个体被抽取之后总体内成分不变何一个个体被抽取之后总体内成分不变(抽样的独立性抽样的独立性)。)。分层随机抽样分层随机抽样n一种有人为干预的限制性随机抽样。一种有人为干预的限制性随机抽样。n按有关的因素或指标将总体划分为互不按有关的因素或指标将总体划分为互不重叠的几个部分(层),再从各部分重叠的几个部分(层),再从各部分(层)中随机地(层)中随机地(独立地)(独立地)抽取一定数抽取一定数量的个体,最后将各个部分(层)中抽量的

59、个体,最后将各个部分(层)中抽取的个体合在一起,组成一个样本。取的个体合在一起,组成一个样本。 分层抽样的抽样比例分层抽样的抽样比例n等比例分层抽样等比例分层抽样n最优配置法最优配置法n内曼配置法内曼配置法nh:各层要抽取人数各层要抽取人数nnnh h ; ;Nh:h层的总人数层的总人数h: h: h层的标准差层的标准差机械抽样机械抽样n又称为系统抽样、又称为系统抽样、等距抽样等距抽样,其做法是,其做法是,先将总体中的所有个体按顺序编号,然先将总体中的所有个体按顺序编号,然后每隔一定的间隔后每隔一定的间隔k抽取个体,组成样本。抽取个体,组成样本。整群抽样整群抽样n以整群为单位的抽样方法,即从总

60、体中以整群为单位的抽样方法,即从总体中抽出来的个体同属于某个群体。抽出来的个体同属于某个群体。n使用整群抽样的目的主要是为了方便和使用整群抽样的目的主要是为了方便和节省费用。节省费用。n整群抽样也有缺点,它抽取的个体在总整群抽样也有缺点,它抽取的个体在总体中分布不均匀,因此抽样误差常常大体中分布不均匀,因此抽样误差常常大于简单随机抽样。于简单随机抽样。 第二节样本容量的确定第二节样本容量的确定n估计总体平均数时的必要样本容量估计总体平均数时的必要样本容量 :标准差:标准差:估计最大允许误差:估计最大允许误差若若未知未知例例1拟估计上海市高校四级英语考试的总体平拟估计上海市高校四级英语考试的总体

61、平均数,根据历次考试成绩的标准差为均数,根据历次考试成绩的标准差为13,这次估计这次估计的最大允许误差为的最大允许误差为2分,可信度为分,可信度为95%,问应当抽,问应当抽多少人?多少人?解:解:由由=13,=2,1-=0.95,=13,=2,1-=0.95,所以所以163所以应当抽所以应当抽163人。人。若若未知未知第十五章第十五章 教育测量与评价理论教育测量与评价理论第一节 教育测评概述n一、教育测量n(一)测量的定义n测量是根据法则给事物分派数字。(史蒂文斯1951)n测量这一定义包含了三个要素:n1、法则给事物的属性分派数字的依据n2、事物属性测量的对象或目标n3、数字描述事物属性的符

62、号1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。数据种类(数据的水平)四分法四分法3、按数据测量水平按数据测量水平称名(名义)数据称名(名义)数据等级(顺序)数据等级(顺序)数据等距数据等距数据等比数据(比率数据)等比数据(比率数据)名称名称Name区区分分次次序序距距离离比比率率定性定性Category称名称名Nominal赞成:赞成:26不赞成:不赞成:13等级等级Ordinal甲甲:二等;乙:二等;乙:一等;丙一等;丙:三等三等量化量化Scale等距等距Interval子:子:80;丑:;丑:90;寅:;寅:100等比等

63、比RatioA:160cm;B:170ccm;C:180cm大小加减加减乘除大小加减加减乘除判断:判断:1 1)表示男、女的数据(记号)属于)表示男、女的数据(记号)属于名义名义比率比率名义量表名义量表2 2)百分制记分的数学成绩)百分制记分的数学成绩属于属于等距量表等距量表3 3)五级记分的实习成绩)五级记分的实习成绩属于属于 等级(顺序)量表等级(顺序)量表定类:区别类别定类:区别类别定序:排列顺序定序:排列顺序定距:决定差异定距:决定差异定比:决定比率定比:决定比率适用统计检验适用统计检验2 2检验检验非参数非参数检验检验Z Z、t t、F F检验检验Z Z、t t、F F检验检验间断型

64、间断型数据数据连续型连续型数据数据总体总体样本样本统计量统计量描述统计描述统计作出推断作出推断随机抽样随机抽样参数参数描述描述描述统计:描述统计:对已获得的数据对已获得的数据进行整理、概括,显现其分布进行整理、概括,显现其分布特征的统计方法。特征的统计方法。(主要是对主要是对样本数据的处理样本数据的处理)推断统计:推断统计:根据样本所提供的根据样本所提供的信息,运用概率的理论进行分信息,运用概率的理论进行分析、论证,在一定可靠程度上析、论证,在一定可靠程度上对总体分布特征进行估计、推对总体分布特征进行估计、推测的统计方法。测的统计方法。(在一定风在一定风险下,部分推断全体险下,部分推断全体)抽

65、样抽样设计设计三、统计学与教育统计学的内容统教统教计育计育学统学统或计或计学学描述统计描述统计推断统计推断统计实验设计实验设计统计图表统计图表集中量数集中量数差异量数差异量数相关分析相关分析统计估计统计估计假设检验假设检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数检验参数检验非参数检验非参数检验样本选择与分配样本选择与分配实验误差分析实验误差分析因子分析因子分析方差分析方差分析回归分析回归分析抽样设计抽样设计本课程结束语本课程结束语n凡物皆可统计!凡物皆可统计!n“凡物的存在必有其数量”n“凡有数量的东西都可以测量” n“在终极的分析中,一切知识都是历史;n在抽象的意义下,一切科学都是数学;n在理性的基础上,所有的判断都是统计学。” n用统计数据评说,会更好!用统计数据评说,会更好!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号