第九章 统计(公式、定理、结论图表)(新教材)

上传人:gu****iu 文档编号:352458378 上传时间:2023-05-22 格式:DOCX 页数:10 大小:400.75KB
返回 下载 相关 举报
第九章 统计(公式、定理、结论图表)(新教材)_第1页
第1页 / 共10页
第九章 统计(公式、定理、结论图表)(新教材)_第2页
第2页 / 共10页
第九章 统计(公式、定理、结论图表)(新教材)_第3页
第3页 / 共10页
第九章 统计(公式、定理、结论图表)(新教材)_第4页
第4页 / 共10页
第九章 统计(公式、定理、结论图表)(新教材)_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《第九章 统计(公式、定理、结论图表)(新教材)》由会员分享,可在线阅读,更多相关《第九章 统计(公式、定理、结论图表)(新教材)(10页珍藏版)》请在金锄头文库上搜索。

1、第九章统计(公式、定理、结论图表)1.全面调查和抽样调查调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体称为样本.样本量:样本中包含的个体数称为样本量2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本如果抽取是放回的,且每次抽取时

2、总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.4.随机数法(1)定义:先把总体中的个体编号,用随机

3、数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,YN,则称 Y=Y1+Y2+YNN=1Ni=1NYi为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1,Y2,Yk,其中Yi出现的频数fi(i=1,2,k),则总体均值还可以写成加权平均数的形式Y=1Ni=1kfiY

4、i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,yn,则称 y=y1+y2+ynn=1ni=1nyi为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.7.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小

5、值的差;(2)决定组距与组数:当样本容量不超过100时,常分成512组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是1;(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距.小长方形的面积=组距频率组距=频率,各小长方形的面积的总和等于1.8.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图反映统计对象在不同时间(或其他合适情形)的发展变化情况9.第p百分位数一般地,一组数据的第p百分位数

6、是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.10.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=np%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.11.四分位数第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.12.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位

7、置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.13.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.【特别提醒】众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不

8、受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中信息很少的一部分,对极端值不敏感14.一组数据x1,x2,xn的方差和标准差数据x1,x2,xn的方差为1ni=1n(xi-x)2=1ni=1nxi2-x2,标准差为1ni=1n(xi-x)2.15.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,YN,总体的平均数为Y,则称S2=1Ni=1N(Yi-Y)2为总体方差,S=S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1,Y2,Yk,其中

9、Yi出现的频数为fi(i=1,2,k),则总体方差为S2=1Ni=1kfi(Yi-Y)2.16.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,yn,样本平均数为y,则称s2=1ni=1n(yi-y)2为样本方差,s=s2为样本标准差.17.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【特别提醒】对标准差和方差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:0,+).标准差、方差为0时,样

10、本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.18.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1ns12+(x1-x)2+n2ns22+(x2-x)2.1.使用分层随机抽样法应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每

11、个个体等可能入样,需在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.2.进行分层随机抽样的相关计算时,常用到的关系(1)样本容量n总体容量N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;(3)样本的平均数和各层的样本平均数的关系:w=mm+nx+nm+ny=MM+Nx+NM+Ny.典例1:某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服

12、务情况,记这项调查为则完成、这两项调查宜采用的抽样方法依次是( )A分层抽样法,系统抽样法 B分层抽样法,简单随机抽样法C系统抽样法,分层抽样法 D简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样【解析】依据题意,第项调查应采用分层抽样法、第项调查应采用简单随机抽样法故选B 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定3.频率分布直方图的性质(1)因为小长方形的面积=组距频率组距=频率,所以各小长

13、方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.(2)在频率分布直方图中,各小长方形的面积的总和等于1.(3)样本容量=频数相应的频率.4.频率分布直方图中第p百分位数的计算方法方法一:(1)确定百分位数所在的区间a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+p%-fa%fb%-fa%(b-a).方法二:设出百分位数的值,利用百分位数的定义计算.典例2:为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名

14、学生中体重在56.5,64.5的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在56.5,64.5学生的累积频率为20.0320.0520.0520.07=0.4,则体重在56.5,64.5学生的人数为0.4100=40.5.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征6.利用样本数字特征进行决策时的两个关注点

15、(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响较大;中位数是样本数据所占频率的等分线,不受极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.7.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;表示样本数据所占频率的等分线平均数平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;平均数是频率分布直方图的重心,是频率分布直

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 高考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号