《2.2.1用样本的频率分布估计总体分布》课件

上传人:hu****a8 文档编号:51208669 上传时间:2018-08-12 格式:PPT 页数:42 大小:1.32MB
返回 下载 相关 举报
《2.2.1用样本的频率分布估计总体分布》课件_第1页
第1页 / 共42页
《2.2.1用样本的频率分布估计总体分布》课件_第2页
第2页 / 共42页
《2.2.1用样本的频率分布估计总体分布》课件_第3页
第3页 / 共42页
《2.2.1用样本的频率分布估计总体分布》课件_第4页
第4页 / 共42页
《2.2.1用样本的频率分布估计总体分布》课件_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《《2.2.1用样本的频率分布估计总体分布》课件》由会员分享,可在线阅读,更多相关《《2.2.1用样本的频率分布估计总体分布》课件(42页珍藏版)》请在金锄头文库上搜索。

1、2.2.1 用样本的频率分布估计 总体的分布(一)从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息。如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。一、频率分布表与频率分布直方图: 1频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。每组的频数除以样本容量的商叫做该组的频率;频率反映每组数据在样本中所占比例的大小。2样本的频率分布根据随机所抽样本容量的大小,分别 计算某一事件出现的频率,这些频率的 分布规律(取值状况),就叫做样本的 频率分布。为了能直观地显示样本的频率分布情 况,通

2、常我们会将样本的容量、样本中 出现该事件的频数以及计算所得的相应 频率列在一张表中,叫做样本的频率分 布表。3用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的 样本时,我们很难从一个个数字中直接看 出样本所包含的信息,如果把这些数据形 成频数分布或频率分布,就可以比较清楚 地看出样本数据的特征,从而估计总体的 分布情况。用样本估计总体,是研究统计 问题的一个基本思想方法,而对于总体的 分布,我们总是用样本的频率分布对它进 行估计。4列频率分布表的步骤下面我们通过一个具体的实例来阐述这 一方法。某钢铁加工厂生产内径为25.40mm的钢 管,为了掌握产品的生产状况,需定期对 产品进行

3、检测,下面的数据是一次抽样中 的100件钢管的内径尺寸:最大值最小值列频率分布表的方法步骤: 求极差(也称全距,即一组数据中最 大值与最小值的差):计算极差时,需要找出这组数据的最 大值和最小值,当数据很多时,可借助 如下算法(最大值): S1   把这100个数据命名为A(1)、A(2)、 A(3)、A(100); S2   设变量x=A(1); S3 把A(i) (i=2,3,100)逐个与x比 较,如果A(i)>x,则x=A(i);运用上面的算法得出这组样本数据的最 大值是25.56,用类似的算法可以得出最 小值是25.24它们的差为  25.5625

4、.24=  0.32,所以极差等于0.32mm.决定组距与组数那么组数= =10.67,于是分成11组。极差组距样本数据有100个,由上面算得极差为 0.32,取组距为0.03,注意:为方便起见,组距的选择应力求“ 取整”,如果极差不利于分组( 如不能被 组数整除)要适当增大极差,如在左、右 两端各增加适当范围(尽量使两端增加的 量相同).  决定分点,将数据分组将第1组的起点定为25.235,以组距为 0.03将数据分组时,可以分成以下11组: 25.235,25.265),25.265,26.295),  ,  25.535,25.565.分组时,通

5、常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。登记频数,计算频率,列出频率分布表频率= ,如第1小组的频率为 =0.01.频数样本容量1 100频率分布表: 绘制频率分布直方图利用直方图反映样本的频率分布规律, 这样的直方图称为频率分布直方图,简称 频率直方图。 下面仍以上例中的数据加 以说明。(1)频率分布直方图的绘制方法与步骤 S1  先制作频率分布表,然后作直角坐标 系,以横轴表示产品内径尺寸,纵轴表示 频率/组距.S2  把横轴分成若干段,每一段对应一个组 的组距,即在横轴上标上25.235,25.265,   ,

6、25.565表示的点; S3  在上面标出的各点中,分别以相邻两点 为端点的线段为底作矩形,它的高等于该 组的频率/组距,每个矩形的面积恰好是该 组的频率。 这些矩形就构成了频率分布直方图。(2)有关问题的理解  因为小矩形的面积=组距频率/组距= 频率,所以各小矩形的面积表示相应各组 的频率。这样,频率分布直方图就以面积 的形式反映了数据落在各个小组内的频率 大小。在频率分布直方图中,各小矩形的面 积之和等于1.同样一组数据,如果组距不同,横轴、 纵轴单位不同,得到的图的形状也会不同 。不同的形状给人的印象也不同,这种印 象有时会影响我们对总体的判断。同一个总体,由于抽样

7、的随机性,如果 随机抽取另外一个容量为100的样本,所形 成的样本频率分布一般会与前一个样本频 率分布有所不同。但是,它们都可以近似 地看作总体的分布。上例中,如果规定,钢管内径的尺寸在 区间25.32525.475内为优等品,我们可依 据抽样分析统计出产品中优等品的比例, 也就是它的频率。从上表或上图容易看出 ,这个频率值等于0.12+0.18+0.25+0.16  +0.13=0.84,于是可以估计出所有生产的 钢管中有84%的优等品。工厂可以根据质 量规范,看看是否达到优等品率的要求, 如果没有达到,就需要进一步分析原因, 解决问题。频率分布直方图的特点从频率分布直方图可以清楚

8、的看出数 据分布的总体态势,但是从直方图本身 得不出原始的数据内容。所以,把数据 表示成直方图后,原有的具体数据信息 就被抹掉了。例1. 从某校高一年级的1002名新生中用 系统抽样的方法抽取一个容量为100的 身高的样本,数据如下(单位:cm)。 试作出该样本的频率分布表。168165171167170165 170 152 175 174 165 170168 169 171 166 164 155 164 158170 155 166 158 155 160 160 164 156 162160 170 168 164 174 171 165 179 163 172 180 174 17

9、3 159 163 172 167 160 164 169151 168 158 168 176 155 165 165 169 162177158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155167 163 164 158 168 167 161 162 167 168161 165 174 156 167 166 162 161 164 166解:最大值=180,最小值=151,极差=29,决定分为10组;则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数。可取区间150

10、.5, 180.5分组        频数        频率150.5,153.5)          4        0.04153.5,156.5)          8        0.08156.5,159.5)          8      

11、  0.08159.5,162.5)          11        0.11162.5165.5)          22        0.22165.5,168.5)          19        0.19168.5,171.5)          

12、14        0.14171.5,174.5)          7        0.07174.5,177.5)          4        0.04177.5,180.5)          3        0.03合计       &n

13、bsp; 100          1频率分布直方图为:例2下表给出了某校500名12岁男孩中用 随机抽样得出的120人的身高(单位cm) (1)列出样本频率分布表(2)估计身高小于134cm的人数占总人数的 百分比.。 区间界限122,126 )126,130 )130,134 )134,138 )138,142 )142,146 )人数5810223320区间界限146,150 )150,154 )154,158 )   人数1165   解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩

14、出现的频率为0.04+0.07+ 0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%例3为了了解一大片经济林生长情况, 随机测量其中的100株的底部 周长,得到 如下数据表(单位:cm)1359810211099121110961001031259711711311092102109104112109124871319710212310410412810512311110310592114108104102129126971001151111061171041091118911012180120121104108118129999099121123107111911009

15、91011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100  cm的树木约占多少,周长不小于120cm 的树木约占多少分组频数频率频率/组 距 80,85)10.010.002 85,90)20.020.004 90,95)40.040.008 95,100)140.140.028 100,105)240.240.048 105,110)150.150.030 110,115)120.120

16、.024 115,120)90.090.018 120,125)110.110.022 125,130)60.060.012 130,13520.020.004 合计10010.2解:(1)这组数据 的最大值为135,最 小值为80,全距为55 ,可将其分为11组, 组距为5频率分布 表如下:(2)直方图如图 (3)从频率分布表得,样本中小于100的 频率为0.01+0.02+0.04+0.14=0.21,样本中 不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100cm 的树木约占21%,周长不小于120cm的树 木约占19%1. 有一个容量为的样本数

17、据,分组后各组的 频数如下: (12.5,15.5,3; (15.5,18.5,8; (18.5,21.5,9; (21.5,24.5, 11; (24.5,27.5,10; (27.5,30.5,4.  由此估计,不大于27.5的数 据约为总体的 (        )                               A91%         B

18、92%C95%         D30%A练习题:2.  一个容量为20的样本数据,数据的分 组及各组的频数如下: (10,20),2;(20,30),3;(30 ,40),4;(40,50),5;(50,60 ),4;(60,70),2. 则样本在区间(,50)上的频 率为 (        ) A0.5B0.7C0.25 D0.05B3.  从高三学生中抽取50名同学参加数学竞 赛,成绩的分组及各组的频数如下:(单 位:分)40,50),2;50,0),3;60, 70),10;70,80)

19、,15;80,90),12; 90,100),8;  (1)列出样本的频率分布表(含累计频率); (2)画出频率分布直方图; (3)估计成绩在60,90)分的学生比例; (4)估计成绩在85分以下的学生比例。解:(1)频率分布表如下:(2)频率分布直方图如下:(3)估计成绩在60,90)分的学生比例;解:(3)成绩在60,90)的学生比例即为 学生成绩在60,90)的频率,0.2+0.3+0.24  =0.74. (4)估计成绩在85分以下的学生比例。(4)成绩在85分以下的学生比例即为学生 成绩不足85分的频率,设相应频率为b,由        

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号