文档详情

教育测量与评价教育统计学

工****
实名认证
店铺
PPT
1.54MB
约142页
文档ID:569715738
教育测量与评价教育统计学_第1页
1/142

教育测量与评价教育测量与评价2011.02-11.06教材:华东师范大学 王孝玲编著课时数:64-72课时,3-4 学分章节数:共十五章,三大部分描述统计,推断统计,抽样设计教育统计学教育统计学huangrongliang@ 695013 两个理论基础n“凡物的存在必有其数量” -- (美国心理学家桑代克1875-1949)n“凡有数量的东西都可以测量” --(美国测量学者麦柯尔) 复杂的因果关系:复杂的因果关系:随机现象随机现象n在因果关系复杂的条件下在因果关系复杂的条件下n无法根据已知的有限原因精确地预测结果无法根据已知的有限原因精确地预测结果n因为即使在已知条件相同的情况下,每一因为即使在已知条件相同的情况下,每一次预测也都是有偏差的次预测也都是有偏差的n随机现象随机现象 n学生成绩学生成绩n心理测验得分心理测验得分n候车人数候车人数n作物产量作物产量n产品质量产品质量n收入支出收入支出n等等等等 随机现象随机现象n在一定的条件下,可能出现也可能不出现,可在一定的条件下,可能出现也可能不出现,可能这样出现,也可能那样出现的一类现象能这样出现,也可能那样出现的一类现象。

n特征:条件不能完全决定结果特征:条件不能完全决定结果n研究内容:出现的可能性有多大,不出现的可研究内容:出现的可能性有多大,不出现的可能性有多大,能性有多大,n或者这样出现的可能性有多大,那样出现的可或者这样出现的可能性有多大,那样出现的可能性有多大能性有多大 数量差异性与数量规律性数量差异性与数量规律性n数量差异性:一定条件下,出现可能数量差异性:一定条件下,出现可能不一样;不一样;n数量规律性:通过大量试验和观察,数量规律性:通过大量试验和观察,总结出随机现象的规律总结出随机现象的规律n数量规律性:平均数;方差、标准差;数量规律性:平均数;方差、标准差;比率、百分比;相关系数等比率、百分比;相关系数等n非数量规律性:非数量规律性:数量分布数量分布 二、统计学和教育统计学n统计学就是研究随机现象的数量规律性的一门统计学就是研究随机现象的数量规律性的一门数学分支数学分支1、统计学含义:Statistics 原意是国力、国势定义定义1:统计学是研究统计原理和方法的科学统计学是研究统计原理和方法的科学 P1定义定义2:统计学是研究如何搜集、整理、分析反映事:统计学是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。

征进行推断的原理和方法                  研究什么(对象)、怎么做?干什么(目的)研究什么(对象)、怎么做?干什么(目的)           “研究研究  搜集、整理、分析搜集、整理、分析  数字资料数字资料  推断推断  “总体特征总体特征”原理和方法原理和方法部分推断全体部分推断全体 2、教育统计学的含义:  教育统计学是运用数理统计的原理和方式研究  教育统计学是运用数理统计的原理和方式研究教育问题的一门应用科学教育问题的一门应用科学  它的主要任务是研究如何搜集、整理、分析由  它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的客观规律教育与心理统计学) 三、统计学与教育统计学的内容     数理统计学1.统计学        教育统计学         应用统计学    农业统计学             人口统计学2.统计学或教育统计学具体内容: 三、统计学与教育统计学的内容统教统教计育计育学统学统或计或计 学 学描述统计描述统计推断统计推断统计实验设计实验设计统计图表统计图表集中量数集中量数差异量数差异量数相关分析相关分析统计估计统计估计假设检验假设检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数检验参数检验非参数检验非参数检验样本选择与分配样本选择与分配实验误差分析实验误差分析因子分析 因子分析 ……方差分析方差分析回归分析回归分析抽样设计抽样设计 三、统计学与教育统计学的内容  1、描述统计(、描述统计(descriptive statistics)::对已获对已获得的数据进行整理、概括,显现其分布特征的统计得的数据进行整理、概括,显现其分布特征的统计方法。

方法P2 (主要是对样本数据的处理主要是对样本数据的处理))  2、推断统计、推断统计(inferential statistics )::根据样根据样本所提供的信息,运用概率的理论进行分析、论证,本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测在一定可靠程度上对总体分布特征进行估计、推测的统计方法的统计方法在一定风险下,在一定风险下,部分推断全体部分推断全体)) 3、实验设计、实验设计(experimental statistics )::为提为提示实验中自变量与因变量的关系,在实验之前所制示实验中自变量与因变量的关系,在实验之前所制订的实验计划订的实验计划 1.确定现象2.随机现象,随机事件,随机变量 *统计处理的变量都是随机变量五、统计学中几个基本概念3.个体(Case )、总体(Population)与样本(Sample)  总体--无限总体与有限总体;N表示数目  样本--大样本(n>30)与小样本(n≤30)  总体与样本是相对的4.统计量( Statistic )与参数(Parameter)  统计量:样本上的数字特征;  参数:总体上的各种数字特征。

      总体总体样本样本统计量统计量描述统计描述统计作出推断作出推断随机抽样随机抽样描述描述 总体总体Population.样本样本Sample个体个体Case变量变量Vari.XNxnxi容量容量SizeNni结果结果Value参数Parameter统计量Statistic数据Data统计方法统计方法Stat.推断统计Inf.Stat.描述统计Des.Stat.计数 Count总体、样本与个体总体、样本与个体 一、统计数据                               来源            来源                                                                                    数据    数据           种类  种类                  特性:    特性:                    统计分类        统计分类                     经常性资料经常性资料专题性资料专题性资料:报表:报表教育调查 教育调查                         教育实验教育实验::二分法和四分法二分法和四分法变异性、规律性变异性、规律性 1 1、按数据观测方法和来源:、按数据观测方法和来源:数据种类(数据的水平)二分法二分法点计数据(点计数据(计数数据计数数据))度量数据(度量数据(测量数据测量数据))2、按数学属性:、按数学属性:间断数据(离散、不连续)间断数据(离散、不连续)连续数据(连续数据(连续型随机变量连续型随机变量))▲▲(百分制的分数理论上讲是间断的,但由于(百分制的分数理论上讲是间断的,但由于数据密度大较多,实际处理时归入连续型数据数据密度大较多,实际处理时归入连续型数据处理,连续型数据处理较方便,类似以后也有,处理,连续型数据处理较方便,类似以后也有,总体比率用正态分布处理。

总体比率用正态分布处理 间断型随机变量间断型随机变量n取值个数有限的数据取值个数有限的数据n人数人数n个数个数n名次名次n五分制得分五分制得分…… 连续型随机变量连续型随机变量n取值个数无限的数据取值个数无限的数据n身高身高n体重体重n智商智商n时间长短时间长短n百分制得分百分制得分……问题:为什么要进行数据分类?问题:为什么要进行数据分类? 数据有不同属性(可分);数据有不同属性(可分);不同类型数据用不同统计方法处理不同类型数据用不同统计方法处理 1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)2、按数学属性:间断(离散)数据与连续数据数据种类(数据的水平)四分法四分法3、、按数据测量水平按数据测量水平称名数据称名数据等级(顺序)数据等级(顺序)数据等距数据等距数据等比数据(比率数据)等比数据(比率数据) (标题标题、表号、标目标目、线条线条、数字数字、表注)六部分;(标题标题、图号、标目标目、图形图形、图注)五个方面  简单表、分组表(1个标志)、复合表(2个及以上标志 直条图(条形图)、圆形图、线形图、频数分布图多变量图:散点图、雷达图、脸谱图等二、统计表、统计图 n例1.小教本011(30名)教育统计学单元考试成绩58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。

频数分布表制作步骤频数分布表制作步骤 58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90n一般不少于一般不少于5组,也不要超过组,也不要超过15组n组距指的是每一个组内包含的距离(用组距指的是每一个组内包含的距离(用i表示)表示)n斯特奇斯(斯特奇斯(H.A. Sturges))根据经验公式:根据经验公式: 本例为本例为i=7.11i=7.11,,将组距调节为将组距调节为1010,即每,即每1010分为一个组分为一个组组数:组数:42/10=4.242/10=4.2,应该分,应该分5 5组1)求全距求全距R: 全距指的是全部观察值中最大值与最小值之差R=xmax- xmin=100--58=422)决定组数决定组数k和组距和组距iK==R/i 频数分布表制作步骤频数分布表制作步骤3)决定组限决定组限n组限就是每一组的起点值和终点值组限就是每一组的起点值和终点值4)登记频数登记频数小教本小教本011011教育统计学单元考试学生成绩频数、累积频数分布表教育统计学单元考试学生成绩频数、累积频数分布表分数50-60-70-80-90-合计组中值5565758595频数14551530累积频数15101530 小教本小教本011011教育统计学单元考试学生成绩频数分布直方图教育统计学单元考试学生成绩频数分布直方图 第三章 常用的特征量1.集中量:平均数、中位数、众数;百分位数集中量:平均数、中位数、众数;百分位数2.差异量:全距、四分位距、平均差、方差      差异量:全距、四分位距、平均差、方差      和标准差、差异系数;百分位距。

和标准差、差异系数;百分位距3.地位量:4.相关量:5.分布形态量:偏态量、峰态量 集中量集中量   集中量是代表一组数据典型水平或集中趋   集中量是代表一组数据典型水平或集中趋势的量它能反映频数分布中大量数据向某一势的量它能反映频数分布中大量数据向某一点集中的情况点集中的情况               集中量包括集中量包括算术平均数、加权平均数、几算术平均数、加权平均数、几何平均数、调和平均数、中位数何平均数、调和平均数、中位数、众数等  算术平均数算术平均数      算算术术平平均均数数是是所所有有观观察察值值的的总总和和除除以以总总频数所得之商,简称为平均数或均数频数所得之商,简称为平均数或均数样本平均数样本平均数                 总体平均数总体平均数 算术平均数的优点算术平均数的优点n反应灵敏;反应灵敏;n严密确定,简明易懂,计算方便;严密确定,简明易懂,计算方便;n适合代数运算;适合代数运算;n受抽样变动的影响较小;受抽样变动的影响较小;n样本算术平均数是总体平均数的最好估样本算术平均数是总体平均数的最好估计值计值 算术平均数的缺点算术平均数的缺点n易受两极端数值(极大或极小)的影响;易受两极端数值(极大或极小)的影响;      n一一组组数数据据中中某某个个数数值值的的大大小小不不够够确确切切时时就无法计算其算术平均数。

就无法计算其算术平均数      这种这种“两极端数值两极端数值”存在的问题,存在的问题,可用什可用什么办法解决?么办法解决? 中位数中位数(Md)      中中位位数数是是位位于于依依一一定定顺顺序序排排列列的的一一组组数数据据中中央央位位置置的的数数值值,,在在这这一一数数值值上上、、下各有一半频数分布下各有一半频数分布着          中位数的原始数值计算方法:中位数的原始数值计算方法:单数:单数:12  14  15  15  17  18  20  23  24:  17双数:双数:12  14  15  15  17  18  20  23  24  25:  17.5 中位数的应用及其优缺点中位数的应用及其优缺点      中中位位数数虽虽然然也也具具备备一一个个良良好好的的集集中中量量所所应应具具备备的的某某些些条条件件,,例例如如比比较较严严格格确确定定、、简简明明易易懂懂,,计计算算简简便便,,受受抽抽样样变变动动影影响响较较小小,,但但是是它它不不适适合合进进一一步步的的代代数运算数运算它适用于以下几种情况:它适用于以下几种情况:      ((1)一组数据中有特大或特小两极端数值时;)一组数据中有特大或特小两极端数值时; ((2)一组数据中有个别数据不确切时;)一组数据中有个别数据不确切时;((3)资料属于)资料属于等级等级性质时。

性质时 众数众数(Mo)n众数是集中量的一种指标众数是集中量的一种指标n对对众众数数有有理理论论众众数数及及粗粗略略众众数数两两种种定定义义方法方法n理理论论众众数数是是指指与与频频数数分分布布曲曲线线最最高高点点相相对对应应的横坐标上的一点的横坐标上的一点n粗粗略略众众数数是是指指一一组组数数据据中中频频数数出出现现最最多多的的那那个数 众数的优缺点众数的优缺点      众众数数虽虽然然简简明明易易懂懂,,但但是是它它并并不不具具备备一一个个良良好好的的集集中中量量的的基基本本条条件件它它主主要在以下情况下使用:要在以下情况下使用:n当当需需要要快快速速而而粗粗略略地地找找出出一一组组数数据据的的代代表值时;表值时;n当当需需要要利利用用算算术术平平均均数数、、中中位位数数和和众众数数三者关系来粗略判断频数分布的形态时;三者关系来粗略判断频数分布的形态时;n利利用用众众数数帮帮助助分分析析解解释释一一组组频频数数分分布布是是否确实具有两个频数最多的集中点时否确实具有两个频数最多的集中点时 正态正偏态负偏态P34 加权平均数加权平均数   加权平均数是不同比重数据(或平  加权平均数是不同比重数据(或平均数)的平均数。

计算公式为:均数)的平均数计算公式为: 二、差异量二、差异量1.1.差异量:表示一组数据变异程度或离散程度的量差异量:表示一组数据变异程度或离散程度的量2.类型:全距、四分位距、平均差、方差和标准差、    类型:全距、四分位距、平均差、方差和标准差、    差异系数;百分位距差异系数;百分位距注:差异量越大表明数据越参差不齐,分布范围越广注:差异量越大表明数据越参差不齐,分布范围越广 二、差异量二、差异量1、全距(Range):R=xmax- xmin  例1   10、50、58、61、63、69、71、71、71、78、81、  83、86、86、88、99     (16)3、百分位距PD:P93- P7                                              P90- P10 4、平均差:5、方差和标准差:2、四分位距QD=(Q3- Q1)/2=99-10=89 二、差异量二、差异量例1   10、50、58、61、63、69、71、71、71、78、81、         83、86、86、88、995、方差和标准差:●计算方法:1)原始数据法;2)计算工具法;3)其他1)原始数据法:3)计算工具法:4)数学软件:spss等2)频数分布表计算法:●问题讨论:一组数据的标准差,大好呢?还是小好?问题讨论:一组数据的标准差,大好呢?还是小好? 二、差异量二、差异量6、相对差异量:差异系数、相对差异量:差异系数用途:用途:1)比较不同单位资料的差异程度(单位不同))比较不同单位资料的差异程度(单位不同)      2)比较单位相同而平均数相差较大(对象不同))比较单位相同而平均数相差较大(对象不同)      3)判断特殊差异情况)判断特殊差异情况正常范围:正常范围:5%≤CV≤35%不不  正正  常:常:CV>>35%   平均数无意义平均数无意义          CV<<5%  数值计算正确性数值计算正确性应用 应用 1)非零点;)非零点;条件:条件:2)等比量表。

 )等比量表  三、分布形态量三、分布形态量  偏态量与峰态量1、偏态量SK=0:分布对称SK≠0:偏  态SK>0:正偏SK<0:负偏2、峰态量Ku=0.263:正态峰Ku ≠0.263:非正态Ku> 0.263 :低阔峰Ku< 0.263 :高狭峰 偏态量偏态量负偏正偏 第五章 概率及概率分布n概率的一般概念n概率分布:离散分布与连续分布        二项分布与正态分布n正态曲线的面积与纵线n正态分布在测量上的应用 5.15.1 概率 概率(probability)(probability)的一般概念的一般概念一、概率的定义二、概率的性质●  0≤P(A)≤1●  P(A)=0:不可能事件●  P(A)=1:必然事件三、概率的加法和乘法三、概率的加法和乘法▲小概率事件A:p(A) ≤0.05▲小概率原理:小概率事件在一次试验中,几乎不可小概率事件在一次试验中,几乎不可能发生 5.25.2 二项分布( 二项分布(bionimalbionimal distribution) distribution)二、二项分布函数二、二项分布函数2.二项分布函数二项分布函数在在n次试验中成功事件次试验中成功事件P恰好出现恰好出现x次的概率次的概率例 在男生占例 在男生占2/5的学校中随机抽取的学校中随机抽取10个学生,问正好抽个学生,问正好抽到到4个男生的概率是多少?至多抽到个男生的概率是多少?至多抽到2个男生的概率是多少个男生的概率是多少??1 1)是否是二项试验?)是否是二项试验? 2 2)共试验次数?)共试验次数?3 3)所求随机事件出现次数?)所求随机事件出现次数?        例 在男生占例 在男生占2/5的学校中随机抽取的学校中随机抽取10个学生,问个学生,问正好抽到正好抽到4个男生的概率是多少?至多抽到个男生的概率是多少?至多抽到2个男生的个男生的概率是多少?概率是多少?解:解:随机抽取一个学生即随机试验一次,因为试验结随机抽取一个学生即随机试验一次,因为试验结果只有两个果只有两个: :“男生男生”与与“女生女生”,而且抽到男生,而且抽到男生与抽到女生是没有关系的,故此试验是贝努利试与抽到女生是没有关系的,故此试验是贝努利试验。

验正好抽到正好抽到4 4个男生的概率:个男生的概率:至多抽到至多抽到2 2个男生的概率是:个男生的概率是:二项分布(二项分布(bionimalbionimal distribution) distribution) 5.25.2 二项分布( 二项分布(bionimalbionimal distribution) distribution)三、二项分布图二项分布的形态:P=q:对称p≠q:偏态1)当当n→∞时,二项分布时,二项分布→正态分布;正态分布;2)当当np≥5且且nq ≥5时,二项分布开始接近正态分布时,二项分布开始接近正态分布 5.25.2 二项分布( 二项分布(bionimalbionimal distribution) distribution)四、二项分布的平均数和标准差四、二项分布的平均数和标准差  当  当二项分布开始接近正态分布二项分布开始接近正态分布时,在时,在n次二项试次二项试验中成功事件出现的平均数和标准差是验中成功事件出现的平均数和标准差是:例 从我们班中随机抽取例 从我们班中随机抽取10名同学,从理论上讲,名同学,从理论上讲,平均应抽到男生多少个?标准差是多少?平均应抽到男生多少个?标准差是多少?五、二项分布的应用五、二项分布的应用1.求求n次二项试验中成功事件出现的概率;次二项试验中成功事件出现的概率;2.判断试验结果的机遇性与真实性的界限(判断试验结果的机遇性与真实性的界限(1的反向)。

的反向)         正态分布正态分布                  的图形特点的图形特点 正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于 对对称的钟形曲线称的钟形曲线. .特点是特点是““两头小,中间大,左右对称两头小,中间大,左右对称””. . 即,取x=μ附近值的可能性大,取偏离x=μ越远的值的可能性越小 5.35.3 正态分布( 正态分布(normal distribution)normal distribution)二、正态曲线的面积与纵线二、正态曲线的面积与纵线2.标准正态曲线下的面积及Z值计算:2)查表法A、已知Z值求面积P:a)求P(0z1)或或P(zP(z<-z<-z1 1) ) ::c)求P(z11)、、 P(zP(z<-1.96) <-1.96) 、、 P(zP(z<1.96)<1.96)例例3,,P(1

5.35.3 正态分布( 正态分布(normal distribution)normal distribution)三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用 1.将原始分数转换成标准分数将原始分数转换成标准分数Z值;值;例1.  2001年某市公务员选拔考试甲、乙二人成绩:写作法规综合合计∑ XZXZXZXZ甲878098265乙9583882668578958.95.66.30.221.12 5.35.3 正态分布( 正态分布(normal distribution)normal distribution)三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用1.将原始分数转换成标准分数Z值;结论:Z甲> Z乙标准分数体系:T = KZ + CT=10Z+50例1.  2001年某市公务员选拔考试甲、乙二人成绩:写作法规综合合计∑ XZXZXZXZ甲870.22800.36980.48265乙951.12830.8988-1.112668578958.95.66.31.061.060.910.91 5.35.3 正态分布( 正态分布(normal distribution)normal distribution)三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用1.将原始分数转换成标准分数Z值;例1.  2001年某市公务员选拔考试甲、乙二人成绩:写作法规综合合计∑ XZXZXZXZT甲870.22800.36980.482651.06乙951.12830.8988-1.112660.918578958.95.66.3T=10Z+50标准分数体系:T = KZ + C60.660.659.159.1 5.35.3 正态分布 正态分布((normal distribution)normal distribution)三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用1.将原始分数转换成标准分数Z值;2.确定录取的分数线;例例1 某年高考平均分 某年高考平均分500,标准差,标准差100,考分呈正态分,考分呈正态分布,某考生得到布,某考生得到650分。

设当年高考录取率为分设当年高考录取率为10%,问%,问该生能否被录取?该生能否被录取?录取率10%--     X0=?P(Z>Z0)=0.1P( 0< Z < Z0 )=0.4Z0=1.28 X X0 0=628=628 5.35.3 正态分布( 正态分布(normal distribution)normal distribution)三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用1.将原始分数转换成标准分数Z值;2.确定录取的分数线; 例2 某项职业录取考试,在参加的1600人中准备录取200人,考试分数接近正态分布,去年同样考试的平均分数为74分,标准差为11,问今年录取分数会多少?求录取率 p=n/NP(Z>Z0)=pP( 0< Z < Z0 )=0.5-pZ0已知录取人数 --     求最低录取分数 查查表表 5.3 正态分布(normal distribution)三、正态分布在测验记分方面的应用 3.确定等级评定的人数; 例2 如果100个人的教育实习成绩呈正态分布,现将其分成优、良、中、合格、不合格五个不合格五个等距的等级,问各等级应有相应的多少人?等距分点已知等级数k--求各等级人数ni确定相应界值Zi求相应面积Pi 第六章 抽样分布及总体平均数的推断n总体分布、抽样分布、样本分布n样本平均数与总体平均数离差统计量的形态n总体平均数的估计n假设检验基本原理n总体平均数显著性检验n抽样分布-参数估计-假设检验抽样分布-参数估计-假设检验 6.1抽样分布抽样分布及有关性质  例2 某市共有3600人大学生参加了全市大二学生的统一英语测试,现在随机抽取50人为样本,其平均分数为85分,标准差10分,试问该市平均分数为多少?  平均数抽样分布:容量为  平均数抽样分布:容量为50,一切可能个的样,一切可能个的样本平均数的频数(频率)分布。

本平均数的频数(频率)分布所有样本平均数的平均数所有样本平均数的平均数抽样分布抽样分布的的平均数平均数平均数平均数 6.1抽样分布抽样分布及有关性质•总体分布:总体内个体数值的频数分布总体分布:总体内个体数值的频数分布•抽样分布抽样分布:某一种:某一种统计量统计量的概率分布的概率分布•样本分布:样本内个体数值的频数分布样本分布:样本内个体数值的频数分布平均数抽样分布平均数抽样分布、标准差抽样分布、中位数抽样分布抽样分布抽样分布  样本        总体  样本        总体估计、检验估计、检验 6.1抽样分布抽样分布及有关性质1.分布概念及分布概念及相关符号相关符号总体分布总体分布:总体内个体数值的频数分布抽样分布抽样分布:某一种统计量的概率分布样本分布样本分布:样本内个体数值的频数分布平均数 标准差平均数 标准差   又称   又称平均数标准误,反映了抽样误差的大小平均数标准误,反映了抽样误差的大小平均数抽样分布标准差平均数抽样分布标准差        意义?意义? 6.1抽样分布抽样分布及有关性质1.分布概念及相关符号2.平均数抽样分布的几个定理平均数抽样分布的几个定理4)总体)总体不是正态分布不是正态分布,如果,如果样本容量较大样本容量较大,则反映,则反映总体  和  的样本平均数的抽样分布,也总体  和  的样本平均数的抽样分布,也接近正接近正态分布态分布。

   又称   又称平均数标准误,反映了抽样误差的大小平均数标准误,反映了抽样误差的大小1)2)3)从正态总体中,随机抽取的容量为)从正态总体中,随机抽取的容量为n的一切可能样的一切可能样本平均数的分布(本平均数的分布(平均数抽样分布平均数抽样分布),也呈正态分布),也呈正态分布 6.1抽样分布抽样分布及有关性质3.样本平均数与总体平均数离差统计量的形态1)总体标准差   已知:正态分布            Z分布:2)总体标准差 )总体标准差  未知:未知:t分布分布 6.1抽样分布抽样分布及有关性质3.样本平均数与总体平均数离差统计量的形态1)  已知:Z分布2)  未知: t分布t分布分布 (t-distribution)英国统计学家高赛特英国统计学家高赛特((W.S.Gossett)1908年以笔名年以笔名“student”发表的一篇论文中推导的一发表的一篇论文中推导的一种分布因此也称为学生分布因此也称为学生分布 6.2 总体平均数的估计总体平均数的估计例例2 2 某市共有 某市共有36003600人大学生参加了全市大二学生的统人大学生参加了全市大二学生的统一英语测试,现在随机抽取一英语测试,现在随机抽取5050人为样本,其平均分数人为样本,其平均分数为为8585分,标准差分,标准差1010分,试问该市平均分数为多少?分,试问该市平均分数为多少?一、总体参数点估计一、总体参数点估计评价标准: 评价标准: 1.无偏性无偏性            2.有效性有效性P87          3.一致性一致性二、总体参数区间估计二、总体参数区间估计 6.2 总体平均数的估计总体平均数的估计二、总体参数区间估计一)总体标准差   已知:Z估计α/21 1--αα 例2 某种零件的长度服从正态分布。

已知总体标准某种零件的长度服从正态分布已知总体标准差差σ=1.5厘米从总体中抽取厘米从总体中抽取100个零件组成样本,测个零件组成样本,测得它们的平均长度为得它们的平均长度为10.00厘米试估计在厘米试估计在99%置信置信水平下,全部零件平均长度的置信区间水平下,全部零件平均长度的置信区间解:因为总体标准差解:因为总体标准差σσ=1.5=1.5已知,所以   的分布已知,所以   的分布服从正态分布,即可用服从正态分布,即可用Z Z估计所以,估计所以,          所以,全部零件平所以,全部零件平均长度均长度99%的可能在的可能在((9.61,,10.39)范围内10±0.39 1)  已知:Z估计2)  未知: t估计t分布分布 (t-distribution)英国统计学家高赛特英国统计学家高赛特((W.S.Gossett)1908年以笔名年以笔名“student”发表的一篇论文中推导的一发表的一篇论文中推导的一种分布因此也称为学生分布因此也称为学生分布二、正态总体均值二、正态总体均值μμ的区间估计的区间估计 二、正态总体均值二、正态总体均值μμ的区间估计的区间估计对于给定的置信度(1-α)及自由度(n-1)总体均值μ 的置信区间:α/21- α一)总体标准差   已知:Z估计二)总体标准差 二)总体标准差   未知:未知:t估计估计 6.2 总体平均数的估计总体平均数的估计二、正态总体均值二、正态总体均值μ的区间估计的区间估计一)总体标准差   已知:Z估计二)总体标准差   未知:t估计例例3 3 某市共有 某市共有36003600人大学生参加了全市大二学生的统一人大学生参加了全市大二学生的统一英语测试,现随机抽取英语测试,现随机抽取5050人为样本,其平均分数为人为样本,其平均分数为8585分,分,标准差标准差1010分,分,试求总体平均数的试求总体平均数的95%的置信区间?的置信区间?解:因为总体标准差解:因为总体标准差σσ未知,所以   的分布服从未知,所以   的分布服从t t分布,即可用分布,即可用t t估计。

所以,估计所以,因为因为n=50,所以,所以df=n-1=49,查查t表表 得得 6.2 总体平均数的估计总体平均数的估计二、总体参数区间估计一)总体标准差   已知:Z估计二)总体标准差  未知: t分布A.大样本 n>30:B.小样本 n≤30: 例 例.从某小学三年级随机抽取从某小学三年级随机抽取17名学生,其阅读能力名学生,其阅读能力的平均得分为的平均得分为29.92,标准差为,标准差为4.1试估计该校三年级试估计该校三年级阅读能力总体平均数阅读能力总体平均数95%和和99%置信区间置信区间      问题问题:在:在1908年年t分布理论提出前,怎分布理论提出前,怎样解决样解决σσ 未知的估计问题?未知的估计问题? 6.2 总体平均数的估计总体平均数的估计二、正态总体均值二、正态总体均值μ的区间估计的区间估计一)总体标准差   已知:Z估计二)总体标准差 二)总体标准差   未知:未知:t估计估计 总体平均数区间估计一、正态总体标准差 一、正态总体标准差  已知已知: Z估计估计三、正态总体标准差 三、正态总体标准差  未知未知: t估计估计1.小样本小样本2.大样本 大样本 t估计或近似估计或近似Z估计估计 6.3 假设检验(本章节内容)假设检验(本章节内容)n假设检验的有关概念假设检验的有关概念n假设检验基本思路假设检验基本思路n假设检验基本步骤及二类错误假设检验基本步骤及二类错误n总体平均数假设检验(总体平均数假设检验(某总体平均水平某总体平均水平有无显著变化?有无显著变化?)) 6.3 假设检验假设检验一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理3.假设检验基本思路4.假设检验的一般步骤假设检验的一般步骤:1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:Z检验或检验或t检验检验3)选择检验的形式:)选择检验的形式:双侧检验双侧检验或单侧检验或单侧检验4)规定显著性水平:)规定显著性水平:5)统计决断: )统计决断: 拒绝拒绝区域区域接受接受区域区域 6.3 假设检验假设检验 例1 某班进行比奈智力测验,结果   ,已知比奈测验的常模                         ,问该班智力水平(不是这一次的测验结果)是否确实与常模水平有差异?n=1001)提出假设:)提出假设:2)选择检验统计量并计算其值:选择检验统计量并计算其值: 因为总体标准差 因为总体标准差σσ已知,故采用已知,故采用Z检验。

所以,检验所以, 3)选择检验的形式:因为没有资料表明,该班智力水平)选择检验的形式:因为没有资料表明,该班智力水平是否高于或低于常模水平,所以采用双侧检验是否高于或低于常模水平,所以采用双侧检验   4)统计决断:因为                       Z=2即该班智力水平与常模水平,有显著性差异即该班智力水平与常模水平,有显著性差异所以0.01≤p<0.05, <2.58=Z0.01/2  ,,Z0.05/2=1.96

所以, 检验所以, 3)选择检验的形式:因为没有资料表明,该校)选择检验的形式:因为没有资料表明,该校7岁男童岁男童体重是否高于或低于全市体重是否高于或低于全市7岁男童体重,所以采用双侧检岁男童体重,所以采用双侧检验   4)统计决断:因为Z0.01/2=2.58<4.88 ** ,即该校7岁男童体重与全市7岁男童体重,有极其显著性差异所以,p<0.01, 所以在0.01显著性水平上接受H1,而拒绝H0 , 6.3 假设检验假设检验 例2 某区初三英语测验平均分数为某区初三英语测验平均分数为8080,该区某校,该区某校2525份试卷的平均分数和标准差分别为份试卷的平均分数和标准差分别为8383和和1010问该校初问该校初三英语平均分数与全区是否一样?三英语平均分数与全区是否一样?1)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值: 因为总体标准差未知,故采用 因为总体标准差未知,故采用t检验所以, 检验所以, 3)选择检验的形式:因为没有资料表明,该校初三英语)选择检验的形式:因为没有资料表明,该校初三英语成绩是否高于或低于全区水平,所以用双侧检验成绩是否高于或低于全区水平,所以用双侧检验   4)统计决断:)统计决断:因为因为n=25,所以,所以df=n-1=24,查查t表表 得得因为因为t=1.47<2.064=t(24)0.05/2  ,所以,所以p>0.05,所以接受所以接受H0 ,,而拒绝而拒绝H1 。

 即该校初三英语平均成绩与全区水平没有显著差异即该校初三英语平均成绩与全区水平没有显著差异1- - 0.05t=1.47 6.3 假设检验假设检验一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理3.假设检验基本思路4.假设检验的一般步骤:5.假设检验的二类错误:假设检验的二类错误:1)第一类错误:    )第一类错误:    “以真为假以真为假” 弃真错误 弃真错误2)第二类错误:    )第二类错误:    “以假为真以假为真” 取伪错误 取伪错误假设检验是假设检验是概率条件下概率条件下的反证法的反证法•在假设检验中,一般都首先控制第一类错误在假设检验中,一般都首先控制第一类错误 6.3 假设检验假设检验二、平均数的显著性检验小结小结1)提出假设:2)选择检验统计量并计算其值:Z检验或t检验3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断: 正态总体 第七章平均数差异的显著性检验1.需要考虑的问题?需要考虑的问题?2.需要知道什么?需要知道什么?3.共同点:显著性差异检验共同点:显著性差异检验4.不同点:两个样本不同点:两个样本 n需考虑的问题:需考虑的问题:n两总体是否正态分布;两总体是否正态分布;n两样本是否相关两样本是否相关n两总体方差两总体方差σ12和和σ22是否已知;是否已知;如果未知如果未知,则是否则是否σ12 = σ22 ;;n两样本为大样本还是小样本。

两样本为大样本还是小样本 平均数差异的抽样分布平均数差异的抽样分布一、正态总体 相关样本 r已知 平均数差异的抽样分布平均数差异的抽样分布一、正态总体 相关样本 r已知 1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值:Z检验或检验或t检验或检验或3)选择检验的形式:双侧检验或单侧检验)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:)规定显著性水平:5)统计决断: )统计决断: 平均数差异显著性检验步骤平均数差异显著性检验步骤n差异显著性检验的主要过程:差异显著性检验的主要过程:1、确定两总体(样本)是否相关;、确定两总体(样本)是否相关;2、根据问题要求,确定检验形式(双侧或单侧);、根据问题要求,确定检验形式(双侧或单侧);3、看总体标准差是否已知;(已知、看总体标准差是否已知;(已知Z检验)检验)4、、独立且独立且σσ未知,方差是否齐性;(齐性未知,方差是否齐性;(齐性t、不齐性、不齐性t’))5、看是大样本还是小样本;、看是大样本还是小样本;6、判断样本、判断样本Z、、t或或t’值是否落入小概率区域;值是否落入小概率区域;7、若落入小概率区域,还需确定差异的显著性级别。

若落入小概率区域,还需确定差异的显著性级别 7.2 相关样本平均数差异的显著性检验相关样本平均数差异的显著性检验一、配对组的情况(等组实验) 例 例1:为了揭示小学二年级的两种识字教学法是否有:为了揭示小学二年级的两种识字教学法是否有显著性差异,根据学生的智力水平、努力程度、识字显著性差异,根据学生的智力水平、努力程度、识字量多少、家庭力量等条件基本相同的原则,将学量多少、家庭力量等条件基本相同的原则,将学生配成生配成10对,然后把每对学生随机地分入实验组和对对,然后把每对学生随机地分入实验组和对照组实验组施以分散识字法,而对照组施以集中识照组实验组施以分散识字法,而对照组施以集中识字法,后期统一测验如下表字法,后期统一测验如下表 (79.5\71) ((3.459)) 1)提出假设:)提出假设:2)选择检验统计量并计算其值:)选择检验统计量并计算其值: 因为相关样本且总体标准差未知, 因为相关样本且总体标准差未知,故采用故采用t检验所以, 检验所以, 3)选择检验的形式:因为没有资料可以说明,两种教学)选择检验的形式:因为没有资料可以说明,两种教学方法哪一种效果好,所以采用双侧检验。

 方法哪一种效果好,所以采用双侧检验 79.5、71和9.12、9.94   r=0. 704样本均值和标准差:样本均值和标准差:=3.46 4)统计决断:)统计决断:因为因为n=10,所以,所以df=n-1=9,查查t表表 得得                             因为因为t=3.46   >3.25=t(9)0.01/2  ,,                       所以所以p<0.01,所以在所以在0.01显著性水平上接受显著性水平上接受H1,,而拒绝而拒绝H0 即这两种教学方法有极其显著性的差异即这两种教学方法有极其显著性的差异因为因为t=3.46>2.262=t(9)0.05/2  ,,需进一步查需进一步查t(9)0.01/2  ,,** 平均数差异的抽样分布平均数差异的抽样分布二、正态总体 独立样本二、正态总体 独立样本r=0 贝赫兰斯-费舍(Fisher)问题,直至1957年柯克兰与柯克斯解决方案最佳 7.4 方差齐性检验方差齐性检验一、F分布       由例由例1、、2可知,独立样本,总体标准差未知可知,独立样本,总体标准差未知条件下,进行差异显著性检验,首先条件下,进行差异显著性检验,首先      首先首先 要进行要进行总体方差齐性检验总体方差齐性检验。

用总体标准差估计值用总体标准差估计值S总体标准差总体标准差σ未知下,怎样判断未知下,怎样判断                 ??即只要检验即只要检验                无显著性差异即可无显著性差异即可F检验,检验, 英国统计学家费舍英国统计学家费舍R.A.Fisher首创首创 第十章第十章 χχ2 2 检验检验  10.1 χχ2 2分布及分布及χχ2 2检验检验一、一、 χχ2 2检验的特点检验的特点● χχ2 2检验是根据检验是根据样本频数分布样本频数分布,对,对总体分布总体分布进行进行推断推断    的假设检验的假设检验● χχ2 2检验与测量数据假设检验的区别:检验与测量数据假设检验的区别:测量数据测量数据假设检验假设检验数据属性数据属性总体分布总体分布检验对象检验对象χχ2 2检验检验连续型连续型间断型间断型正态分布正态分布未未   知知总体参数总体参数 非总体参数非总体参数 10.1 χχ2 2 分布及分布及χχ2 2检验检验一、一、 χχ2 2检验的特点检验的特点二、二、 χχ2 2检验的统计量检验的统计量三、三、 χχ2 2的抽样分布的抽样分布四、四、 χχ2 2检验应用检验应用例例1  从某大学随机抽取从某大学随机抽取54位老年教师,其中健康状况属位老年教师,其中健康状况属于好的有于好的有15人,中等的有人,中等的有23人,差的有人,差的有16人,问该校老人,问该校老年教师健康状况好、中、差的人数比率是否是年教师健康状况好、中、差的人数比率是否是1::2::1??解:解:1、提出假设、提出假设H0::健康状况好、中、差的人数比率是健康状况好、中、差的人数比率是1::2::1H1::健康状况好、中、差的人数比率不是健康状况好、中、差的人数比率不是1::2::1 2、选择统计量并计算、选择统计量并计算∵∵实际频数:实际频数:∴∴理论频数:理论频数: ft1 =54×1/4=13.5,ft2 =54×2/4 =27,ft3 =54×1/4=13.5。

根据零假设,根据零假设,=1.223、统计决断、统计决断∵∵ df=k-1=2 ,查查 χ2 值表,值表,∴∴∵∵ χχ2 2=1.22<, ∴∴P>0.05,根据根据χχ2 2 检验统计决断规则,检验统计决断规则,所以在所以在0.05显著水平上保留零假设,拒绝备择假设显著水平上保留零假设,拒绝备择假设即该校老年教师的健康状况,好、中、差人数的比率即该校老年教师的健康状况,好、中、差人数的比率是是1::2::1 χ2检验能解决的问题检验能解决的问题n调查人们对于某社会现象的看法,结果调查人们对于某社会现象的看法,结果如下问三种态度人数有无显著差异?如下问三种态度人数有无显著差异?n同质性检验同质性检验赞成赞成不置可否不置可否反对反对11009011022005050310009001100 χ2检验能解决的问题检验能解决的问题n表中表中314名学生的考试成绩是否服从正名学生的考试成绩是否服从正态分布?态分布?n数据正态性的检验数据正态性的检验组组别别45-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99次次数数10 18 22 40 46 72 44 28 18 124 χ2检验能解决的问题检验能解决的问题n对对3627名中小学生的心理测验得到如下名中小学生的心理测验得到如下结果(部分),问性格类型与智力水平结果(部分),问性格类型与智力水平之间有无关联?之间有无关联?n相关性(或独立性)检验相关性(或独立性)检验外倾外倾中间中间内倾内倾智力优秀智力优秀364012智力落后智力落后469288 第二节 单向表的第二节 单向表的χ2检验检验n把实得的点计数据按一种分类标准编制把实得的点计数据按一种分类标准编制成表就是单向表(单因素)成表就是单向表(单因素)赞成赞成不置可否不置可否反对反对10090110 二、一个自由度的二、一个自由度的χ2检验检验n当当df=1,,其中只要其中只要有一个组的理论值有一个组的理论值ft<5,,就要运用亚茨(就要运用亚茨(Yates))连续性连续性校正法校正法:    例   例.某某区区中学团员比例为中学团员比例为0.8,现从,现从该区某中学随机抽取该区某中学随机抽取20人,其中团员人,其中团员12人,问该校团员的比例与全区是否相同?人,问该校团员的比例与全区是否相同?(答案:(答案:3.83<3.84,  P>0.05))ft1 =20× 0.8=16ft2 =20×0 .2=4实际频数:实际频数:理论频数:理论频数:<5且且df=2-1=1,,团员团员非团员非团员 三、次数分布正态性的三、次数分布正态性的χ2检验检验P177•自由度为自由度为K - 3 第三节 双向表的第三节 双向表的χ2检验检验n在双向表的在双向表的χ2检验中,如果要判断两种检验中,如果要判断两种分类特征,即两个因素之间是否有依从分类特征,即两个因素之间是否有依从关系,这种检验称为关系,这种检验称为独立性独立性χ2检验检验。

愿意愿意不愿意不愿意未定未定总和总和nr上上18271055中中20192059下下1871136总和总和nc565341150例例1 家庭经济情况属于上、中、下的高三毕业生,对 家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿意、于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表问学生是否愿意报告师范大未定),其人数如下表问学生是否愿意报告师范大学与家庭经济情况是否有关系?学与家庭经济情况是否有关系? 解:解:1、提出假设、提出假设H0:学生是否愿意报考师范的态度与家庭经济状况:学生是否愿意报考师范的态度与家庭经济状况无关系无关系H1:学生是否愿意报考师范的态度与家庭经济状况:学生是否愿意报考师范的态度与家庭经济状况有关系有关系例例1 家庭经济情况属于上、中、下的高三毕业生, 家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表问学生是否愿意报告师意、未定),其人数如下表问学生是否愿意报告师范大学与家庭经济情况是否有关系?范大学与家庭经济情况是否有关系?2、选择统计量并计算、选择统计量并计算i=1,2,3j=1,2,3       根据零假设及学生对报考师范大学的态度与家庭经根据零假设及学生对报考师范大学的态度与家庭经济状况之间关系的双向表,可计算出相应理论频数。

济状况之间关系的双向表,可计算出相应理论频数 愿意愿意不愿意不愿意未定未定总和总和nr上上18((20.53))27((19.43))10((15.03))55中中20((22.03))19((20.85))20((16.13))59下下18((13.44))7((12.72))11((9.84))36总和总和nc565341150=10.48 3、统计决断、统计决断∴∴ df=(r-1)(c-1)查查 χχ2 2值表,值表,, ∴∴0.01

为相关关系 第一节 相关的意义第一节 相关的意义n相关的概念相关的概念n两个变量之间两个变量之间不精确不精确、、不稳定不稳定的的变化关系变化关系称称为相关关系为相关关系分类:分类:正相关、负相关、零相关正相关、负相关、零相关n相关系数相关系数n用来描述两个变量相互之间变化方向及密切用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数一般用程度的数字特征量称为相关系数一般用 r 表示-1≤r ≤1 相关系数(取值及其意义)1. r 的取值范围的取值范围是是 [-1,1] --1≤r ≤12. |r|=1,,为完全相关为完全相关 r =1,为完全正相关,为完全正相关 r =-1,为完全负正相关,为完全负正相关3. r = 0,,不存在不存在相关相关关系关系4. -1 r<0,,为负相关为负相关5. 0

加、减、乘、除  r=0.2,,r==0.4,,r=--0.8n如果两个变量之间存在因果关系,则这如果两个变量之间存在因果关系,则这种关系可以用相关关系体现出来种关系可以用相关关系体现出来n相关不等于因果:相关系数只能描述两相关不等于因果:相关系数只能描述两个变量之间的变化方向及密切程度,并个变量之间的变化方向及密切程度,并不能揭示二者之间的内在本质联系不能揭示二者之间的内在本质联系 样本、总体相关系数(correlation coefficient)1.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,,称为总体相关系数,记为称为总体相关系数,记为 2.若若是是根根据据样样本本数数据据计计算算的的,,则则称称为为样样本本相相关系数,记为关系数,记为 r 第十二章 回归分析第十二章 回归分析主要内容:主要内容:n一元线性回归一元线性回归n一元线性回归方程的检验一元线性回归方程的检验n一元线性回归方程的应用一元线性回归方程的应用n多元线性回归简介多元线性回归简介变量间的关系:变量间的关系:n相关系数--双向关系相关系数--双向关系n回归方程--单向关系回归方程--单向关系 什么是回归分析? 从从一一组组样样本本数数据据出出发发,,确确定定变变量量之之间的数学关系式;间的数学关系式; 利利用用所所求求的的关关系系式式,,由由一一个个变变量量((自自变变量量))来来预预测测或或控控制制另另一一个个特特定定变变量量的的取取值值,,并并给给出出这这种种预预测测或或控控制制的的精精确程度。

确程度 一元线性回归模型 一元线性回归方程一元线性回归方程n回归线拟合的常用原则,就是使各点与回归线拟合的常用原则,就是使各点与该线纵向距离的平方和为最小该线纵向距离的平方和为最小x xy y 回归线回归线回归线拟合的常用原则,就是使回归线拟合的常用原则,就是使各点与该线各点与该线纵向距离的平方和为最小纵向距离的平方和为最小 回归方程回归方程n确定回归线的方程称回归方程确定回归线的方程称回归方程由由x估计估计Y由由Y估计估计x 由由Y估计估计X 估计方程的求法(例题分析)【【例例2】】根根据据第第十十一一章章例例子子的的数数据据男男青青年年前前臂长臂长y对身高身高x的线性回归方程的线性回归方程回归方程为:回归方程为:y = 4.897 + 0.2348 x 第十四章 抽样设计(技术)第十四章 抽样设计(技术)n统计的质量取决于数据的质量统计的质量取决于数据的质量n推断统计学各种方法运用的前提推断统计学各种方法运用的前提n就是要先获得对总体有足够代表性的样本资就是要先获得对总体有足够代表性的样本资料或实验数据料或实验数据推断可靠性三因素:数据的质量、统计方法及推断可靠性三因素:数据的质量、统计方法及数据处理的准确性、样本对总体的代表性数据处理的准确性、样本对总体的代表性怎样抽?抽多少? 第一节 抽样调查与抽样方法第一节 抽样调查与抽样方法n从总体中抽取部分个体组成样本,对该从总体中抽取部分个体组成样本,对该样本进行观察,进而推断未知总体情况,样本进行观察,进而推断未知总体情况,称为抽样调查。

称为抽样调查n抽样调查分为非概率抽样调查和概率抽抽样调查分为非概率抽样调查和概率抽样调查两大类样调查两大类 常用的抽样方法常用的抽样方法n简单随机抽样简单随机抽样n分层随机抽样分层随机抽样n机械抽样(系统抽样)机械抽样(系统抽样)n整群抽样和多阶段抽样整群抽样和多阶段抽样 简单随机抽样简单随机抽样n从总体的从总体的N个个体中,完全以随机形式个个体中,完全以随机形式(不加人为干扰地)抽取(不加人为干扰地)抽取n个个体组成一个个体组成一个样本在抽取的过程中,总体中每个个样本在抽取的过程中,总体中每个个体被抽到的个体被抽到的概率是均等概率是均等的,并且在任的,并且在任何一个个体被抽取之后总体内成分不变何一个个体被抽取之后总体内成分不变((抽样的独立性抽样的独立性) 分层随机抽样分层随机抽样n一种有人为干预的限制性随机抽样一种有人为干预的限制性随机抽样n按有关的因素或指标将总体划分为互不按有关的因素或指标将总体划分为互不重叠的几个部分(层),再从各部分重叠的几个部分(层),再从各部分(层)中随机地(层)中随机地(独立地)(独立地)抽取一定数抽取一定数量的个体,最后将各个部分(层)中抽量的个体,最后将各个部分(层)中抽取的个体合在一起,组成一个样本。

取的个体合在一起,组成一个样本 分层抽样的抽样比例分层抽样的抽样比例n等比例分层抽样等比例分层抽样n最优配置法最优配置法n内曼配置法内曼配置法nh :各层要抽取人数各层要抽取人数n==ΣΣn nh h ; ;Nh :h层的总人数层的总人数σσh: h: h层的标准差层的标准差 机械抽样机械抽样n又称为系统抽样、又称为系统抽样、等距抽样等距抽样,其做法是,,其做法是,先将总体中的所有个体按顺序编号,然先将总体中的所有个体按顺序编号,然后每隔一定的间隔后每隔一定的间隔k抽取个体,组成样本抽取个体,组成样本 整群抽样整群抽样n以整群为单位的抽样方法,即从总体中以整群为单位的抽样方法,即从总体中抽出来的个体同属于某个群体抽出来的个体同属于某个群体n使用整群抽样的目的主要是为了方便和使用整群抽样的目的主要是为了方便和节省费用节省费用n整群抽样也有缺点,它抽取的个体在总整群抽样也有缺点,它抽取的个体在总体中分布不均匀,因此抽样误差常常大体中分布不均匀,因此抽样误差常常大于简单随机抽样于简单随机抽样 第二节 样本容量的确定第二节 样本容量的确定n估计总体平均数时的必要样本容量估计总体平均数时的必要样本容量 σσ:标准差:标准差δδ:估计最大允许误差:估计最大允许误差若若σσ未知未知     例例1   拟估计上海市高校四级英语考试的总体平拟估计上海市高校四级英语考试的总体平均数,根据历次考试成绩的标准差为均数,根据历次考试成绩的标准差为13,这次估计这次估计的最大允许误差为的最大允许误差为2分,可信度为分,可信度为95%,问应当抽,问应当抽多少人?多少人?解:解:由由σσ=13,=13,δδ=2,1-=2,1-αα=0.95,=0.95,所以所以==162.3 ≈163所以应当抽所以应当抽163人。

人若若σσ未知未知 第十五章第十五章 教育测量与评价理论教育测量与评价理论 第一节 教育测评概述n一、教育测量n(一)测量的定义n测量是根据法则给事物分派数字史蒂文斯1951)n测量这一定义包含了三个要素:n1、法则——给事物的属性分派数字的依据n2、事物属性——测量的对象或目标n3、数字——描述事物属性的符号 1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)2、按数学属性:间断(离散)数据与连续数据数据种类(数据的水平)四分法四分法3、、按数据测量水平按数据测量水平称名(名义)数据称名(名义)数据等级(顺序)数据等级(顺序)数据等距数据等距数据等比数据(比率数据)等比数据(比率数据) 名称名称Name区区分分次次序序距距离离比比率率定性定性Category称名称名Nominal▲赞成:赞成:26不赞成:不赞成:13等级等级Ordinal▲▲甲甲:二等;乙:二等;乙:一等;丙一等;丙:三等三等量化量化Scale等距等距Interval▲▲▲子:子:80;丑:;丑:90;寅:;寅:100等等比 比 Ratio▲▲▲▲A:160cm;B:170ccm;C:180cm            大小 加减 加减乘除大小 加减 加减乘除判断:判断:1 1)表示男、女的数据(记号)属于)表示男、女的数据(记号)属于名义名义比率比率名义量表名义量表2 2)百分制记分的数学成绩)百分制记分的数学成绩属于属于等距量表等距量表3 3)五级记分的实习成绩)五级记分的实习成绩属于属于 等级(顺序)量表等级(顺序)量表定类:区别类别定类:区别类别定序:排列顺序定序:排列顺序定距:决定差异定距:决定差异定比:决定比率定比:决定比率适用统计检验适用统计检验χχ2 2检验检验非参数非参数检验检验Z Z、、t t、、F F检验检验Z Z、、t t、、F F检验检验间断型间断型数据数据连续型连续型数据数据       总体总体样本样本统计量统计量描述统计描述统计作出推断作出推断随机抽样随机抽样参数参数描述描述描述统计:描述统计:对已获得的数据对已获得的数据进行整理、概括,显现其分布进行整理、概括,显现其分布特征的统计方法。

特征的统计方法 (主要是对主要是对样本数据的处理样本数据的处理))推断统计:推断统计:根据样本所提供的根据样本所提供的信息,运用概率的理论进行分信息,运用概率的理论进行分析、论证,在一定可靠程度上析、论证,在一定可靠程度上对总体分布特征进行估计、推对总体分布特征进行估计、推测的统计方法测的统计方法在一定风在一定风险下,部分推断全体险下,部分推断全体))抽样抽样设计设计 三、统计学与教育统计学的内容统教统教计育计育学统学统或计或计 学 学描述统计描述统计推断统计推断统计实验设计实验设计统计图表统计图表集中量数集中量数差异量数差异量数相关分析相关分析统计估计统计估计假设检验假设检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数检验参数检验非参数检验非参数检验样本选择与分配样本选择与分配实验误差分析实验误差分析因子分析 因子分析 ……方差分析方差分析回归分析回归分析抽样设计抽样设计 本课程结束语本课程结束语n凡物皆可统计!凡物皆可统计!n“凡物的存在必有其数量”n“凡有数量的东西都可以测量” n“在终极的分析中,一切知识都是历史;n在抽象的意义下,一切科学都是数学;n在理性的基础上,所有的判断都是统计学。

n用统计数据评说,会更好!用统计数据评说,会更好! 。

下载提示
相似文档
正为您匹配相似的精品文档