用样本频率分布估计总体分布(0001)

上传人:suns****4568 文档编号:60872845 上传时间:2018-11-19 格式:PPT 页数:44 大小:3.71MB
返回 下载 相关 举报
用样本频率分布估计总体分布(0001)_第1页
第1页 / 共44页
用样本频率分布估计总体分布(0001)_第2页
第2页 / 共44页
用样本频率分布估计总体分布(0001)_第3页
第3页 / 共44页
用样本频率分布估计总体分布(0001)_第4页
第4页 / 共44页
用样本频率分布估计总体分布(0001)_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《用样本频率分布估计总体分布(0001)》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布(0001)(44页珍藏版)》请在金锄头文库上搜索。

1、2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布,我国是世界上严重缺水的国家之一,城市缺水问题较为突出.,为了节约生活用水,某市政府计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超过a的部分按议价收费.,(1)如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,(2)为了较合理地确定这个标准,你认为需要做哪些工作?,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1

2、.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2

3、.2,这些数字告诉我们什么信息?,假设通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:,很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t,其他在0.2t4.3t之间. 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.,下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律. 它可以使我们看到整个样本数据的频率分布情况.,1.通过实例体会分布的意义和作用. 2.会列频率分布表,画频

4、率分布直方图、频率分布折线图和茎叶图.(重点) 3.通过实例体会频率分布直方图、频率分布折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. (难点),频率分布表和频率分布直方图,(1)求极差(一组数据中的最大值与最小值的差).,例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1 t.,(2)决定组距与组数. 设k=极差组距,若k为整数,则组数=k,否则,组数=k+1.,1,为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么 组数=极差组距=4.1 0.5=8.2, 因此可以将数据分为9组,这个组数是比较合适的,于是取组距

5、为0.5,组数为9.,(4)列频率分布表. 计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数样本容量),(3)将数据分组.,以组距为0.5将数据分组时,可以分成以下9组:,0,0.5),0.5,1),4,4.5.,列频率分布表:,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,100,1.00,注意:频数的合计应是样本容量,频率合计应是1.,0.02,频率/组距,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,频率分布表一般分“分组”,“频

6、数累计”(可省),“频数”,“频率”, “频率/组距” 五列,最后一行是合计,(5)画频率分布直方图. 根据频率分布表可以得到如图所示的频率分布直方图:,月均用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,注意横坐标与纵坐标,注意,(2)纵坐标为,频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布.,【总结提升】频率分布直方图画法: 第一步:画平面直角坐标系. 第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度. 第三步:以组距为宽,各组的频率与组距的商为高,分

7、别画出各组对应的小长方形.,宽度:组距,高度:,月均用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,各小长方形的面积之和是否为定值?,各组的频率在图中哪里显示出来?,各小长方形的面积之和为1.,考点一,频率分布直方图,1,宽度:组距,高度:,月均用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,各小长

8、方形的面积之和是否为定值?,各组的频率在图中哪里显示出来?,各小长方形的面积之和为1.,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性. 频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.,(1)居民月均用水量的分布是呈“山峰”状的,而且是“单峰”的;,【即时练习】,考点一,如果市政府希望85%以上的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议? 88%的居民月用水量在3t以下,标准可定

9、为3t. 在实际中,取a=3t一定能保证85%以上的居民用水不超标吗? 在实际中,对统计结论是需要进行评价的.,2 统计评价,有一个容量为50的样本数据的分组的频数如下:,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少?,【即时训练】,【解析】(1)组距为3,分组 频数 频率 频率/ 组距,12.5, 15.5)

10、 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,0.06 0.16 0.18 0.22 0.20 0.10 0.08,0.020 0.053 0.060 0.073 0.067 0.033 0.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,(2),18.5,21.5,24.5,27.5,30.5,33.5,(3)56%,频率分布直方图如下:,月均用水量/t,0.10,0.20,0

11、.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.,o,频率/组距,利用样本频率分布对总体分布进行相应估计: (1)上例的样本容量为100,如果增至1 000,其 频率分布直方图的情况会有什么变化?假如增至 10 000呢? (2)样本容量越大,这种估计越精确. (3)当样本容量无限增大,组距无限缩小,那么 频率折线图就会无限接近于一条光滑曲线 总体密度曲线.,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比).,o,频率/组距,总体密度曲

12、线 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具. 用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比.,茎叶图 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下: 甲运动员得分: 13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39.,茎叶图,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6

13、7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,叶就是从茎的旁边生长出来的数,表示得分的个位数字,茎是指中间的一列数,表示得分的十位数字,从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定.,茎叶图的优、缺点: 在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便. 但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长.,某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的

14、分组依次为,若低于60分的人数是15, 则该班的学生人数是( ) A.45 B.50 C.55 D.60,成绩/分,【即时训练】,【解析】选B.由频率分布直方图,计算出低于60分的人数的频率(前两个小矩形的面积) P=200.005+200.01=0.3,,则总人数为150.3=50,,故选B.,1.将样本容量为100的数据按从大到小的顺序分为8组如下表:,9,12,13,15,14,14,13,10,频数,8,7,6,5,4,3,2,1,组号,则第三组的频率为( ) A.0.14 B.1/14 C.0.03 D.3/14,B,D,5.甲、乙两个班级各随机选出15名同学进行测验,成 绩的茎叶图

15、如图所示.则甲、乙两班的最高成绩分别 是 _, _.从图中看 _班的平均成绩 较高.,96,92,乙,6.某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表. (2)画出频率分布直方图. (3)估计年龄在32岁52岁的知识分子所占的比例约是多少.,【解析】(1)极差为67-28=39,取组距为5,分为8组.,分 组 频数 频率 27,32) 3 0.06 32,37) 3 0.06 37,42) 9 0.18 42,47) 16 0.32 47,52) 7 0.14 52,57) 5 0.10 57,62) 4 0.08 62,67 3 0.06 合 计 50 1.00,样本频率分布表:,(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号