2.2.1用样本的频率分布估计总体的分布

上传人:豆浆 文档编号:1372662 上传时间:2017-06-09 格式:PPT 页数:33 大小:2.16MB
返回 下载 相关 举报
2.2.1用样本的频率分布估计总体的分布_第1页
第1页 / 共33页
2.2.1用样本的频率分布估计总体的分布_第2页
第2页 / 共33页
2.2.1用样本的频率分布估计总体的分布_第3页
第3页 / 共33页
2.2.1用样本的频率分布估计总体的分布_第4页
第4页 / 共33页
2.2.1用样本的频率分布估计总体的分布_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《2.2.1用样本的频率分布估计总体的分布》由会员分享,可在线阅读,更多相关《2.2.1用样本的频率分布估计总体的分布(33页珍藏版)》请在金锄头文库上搜索。

1、2.2.1 用样本的频率分布估计总体分布,1、用样本去估计总体是研究统计问题的一基本思想,2、前面我们学过的抽样方法有: 简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。,3、 初中时我们学习过样本的频率分布,包括频数、 频率的概念,频数分布表和频数分布直方图的制作。,如何用样本的频率分布估计总体分布?,一、频率分布直方图,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。,2000年全国主要城市中缺水情况排在前10位的城市,例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按

2、议价收费。,如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做 哪些工作?,思考:由上表,大家可以得到什么信息?,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:,1.求极差:,步骤:,频率分布直方图,2.决定组距与组数:,组数=,4.3 - 0.2 = 4.1,3.将数据分组(组距0.5,组数9),0,0.5 ),0.5,1 ),4,4.5,4.列频率分布表,100位居民月平均用水量的频率分布表,频率/ 组距,0.080.160.300.440.050.280.120.080.04,5.画频率分布直方图,小

3、长方形的面积,组距,频率,=,注意:,这里的纵坐标不是频率,而是频率/组距;,某个区间上的频率用这个区间的面积表示;,直方图,思考:所有小长方形的面积之和等于?,上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,图形的意义,图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=频率,各小长方形的面积之和=1,宽度:组距,【练一练】1.在某路段检测点对200辆汽车的车速进行检测,检测结果表示为频率分布直方图如图所示,则车速不小于89.5 km/h的汽车约有 _

4、辆.,分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距=极差/组数,三、分组,通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一

5、组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),例1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将

6、数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;,题型一频率分布直方图的绘制,(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.,解(1)以4为组距,列表如下:,(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.,【例2】世界卫生组织指出青少年的身体健康状况是一个应该引起大家足够重视的问题,某校为了了解小学生的体能情况,抽取了一个年级的部分学生进行一分钟跳绳次数测试.将所得数据整理后,画出频率分布直方图,如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,第一个小

7、组的频数为5.,(1)求第四小组的频率;(2)求参加这次测试的学生人数是多少?(3)若在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少?,题型二频率分布直方图的应用,思路:由题目可获取以下信息:一分钟跳绳次数的频率分布直方图;从左到右前三个小组的频率;第一个小组的频数.解答本题可由图读数,再由数进行判断.,练习如图所示是总体的一个样本频率分布直方图,且在15,18)内频数为8.(1)求样本在15,18)内的频率;(2)求样本容量;(3)若在12,15)内的小矩形面积为0.06,求在18,33)内的频数.,解由样本频率分布直方图可知组距为3.,(3)在12,15)内的小矩形

8、面积为0.06,故样本在12,15)内的频率为0.06,故样本在15,33)内的频数为50(10.06)47,又在15,18)内频数为8,故在18,33)内的频数为47839.,2.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在56.5,64.5) kg的学生人数是( )(A)20(B)30(C)40(D)50,【解析】选C.在频率分布直方图中,矩形的面积就是数据落在这一范围的频率,在56.5,64.5) kg范围内的矩形的面积是(0.03+0.05+0.05+0.07)2=0.4,则

9、数据落在这一范围的频率是0.4.所以这100名学生中体重在56.5,64.5)的学生人数是1000.4=40.,二、频率分布折线图,连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线,总体在区间 内取值的频率,S,总体密度曲线,a b,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具

10、.,总体密度曲线,三、茎叶图,初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。,我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是茎叶图。,制作茎叶图的方法,将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。,茎:十位数字,叶:表示个位数字,例1:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50,茎叶图:,注:,1、重复出现的数据要重复记录,不能遗漏;特别

11、是“叶”部分;,2、所有的信息都可以从这个茎叶图中得到;,3、茎叶图便于记录和表示;,4、不足的是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便;,解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.,例3某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,9

12、3,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.,题型三茎叶图及其应用,跟踪训练3如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(),A.2,5 B.5,5 C.5,8 D.8,8,解析由于甲组数据的中位数为1510x,x5.,y8,故选C.,C,【例2】有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取16台,记录某天上午各自的销售情况(单位:元):甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.(1)请作出这两组数据的茎叶图;(2)将这两组数据进行比较分析,你能得到什么结论?,小 结 图形 优点 缺点频率分布 1)易表示大量数据 丢失一些直方图 2)直观地表明分布地 情况 信息 1)无信息损失 只能处理样本 茎叶图 2)随时记录方便记录和表示 容量较小数据,课堂小结,表示样本分布的方法:(1)频率分布表(2)频率分布图(包括直方图和条形图)(3)频率分布折线图(4)茎叶图,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号