用样本的频率分布估计总体的分布1

上传人:ji****72 文档编号:50646784 上传时间:2018-08-09 格式:PPT 页数:37 大小:732KB
返回 下载 相关 举报
用样本的频率分布估计总体的分布1_第1页
第1页 / 共37页
用样本的频率分布估计总体的分布1_第2页
第2页 / 共37页
用样本的频率分布估计总体的分布1_第3页
第3页 / 共37页
用样本的频率分布估计总体的分布1_第4页
第4页 / 共37页
用样本的频率分布估计总体的分布1_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《用样本的频率分布估计总体的分布1》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体的分布1(37页珍藏版)》请在金锄头文库上搜索。

1、2.2 用样本估计总体.2.1用样本的频率分布估计总体分布一、复习 1.随机抽样有哪几种基本的抽样方法?2.统计的基本思想。简单随机抽样、系统抽样、分层抽样.通过从总体中抽取一个样本,根据样 本的情况去估计总体的相应情况.1.频数:在总体(或样本)中,某个个体 出现的次数叫做这个个体的频数。 2.频率:某个个体的频数与总体(或样本 )中所含个体的数量的比叫做这个个 体的频率。 3.性质:在总体(或样本)中,各个个体 的频率之和等于1。二、基本概念及其性质(频数和频率 )4.所有数据(或数据组)的频数的 分布变化规律叫做样本的频率分布 。5.频率分布的表示形式有: 样本频率分布表 样本频率分布图

2、样本频率分布条形图样本频率分布直方图 样本频率分布折线图知识探究(一):频率分布表 【问题】某市政府为了节约生活用水, 计划在本市试行居民生活用水定额管理 ,即确定一个居民月用水量标准a,用水 量不超过a的部分按平价收费,超出a的 部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.

3、7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变

4、化范围是什么?思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组? 0.24.3(4.3-0.2)0.5=8.2思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?思考4:如何统计上述100个数据在各组 中的频数?如何计算样本数据在各组中 的频率?你能将这些数据用表格反映出 来吗?0,0.5),0.5,1),1,1.5), ,4,4.5.分 组组 频频数累计计 频频数 频频率0,0.5) 4 0.040.5,1) 正 8 0.081,1.5) 正 正 正 15 0.151.5,

5、2) 正 正 正 正 22 0.222,2.5) 正 正 正 正 正 25 0.252.5,3) 正 正 14 0.143,3.5) 正 一 6 0.063.5,4) 4 0.044,4.5 2 0.02合计计 100 1.00思考5:上表称为样本数据的频率分布表 ,由此可以推测该市全体居民月均用水 量分布的大致情况,给市政府确定居民 月用水量标准提供参考依据,这里体现 了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表 ,你对制定居民月用水量标准(即a的取值 )有何建议?88%的居民月用水量在3t以下,可建议

6、取a=3. 思考7:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多.按统计原理,若样本的容量为n,分 组数一般在(1+3.3lgn)附近选取.当样本容 量不超过100时,按照数据的多少,常分成5 12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗?思考8:一般地,列出一组样本数据的频率分 布表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差)第二步,决定组距与组数. (设k=极差组距,若k为整数,则组 数=k,否则,组数=k+1) 第

7、三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数样本容量)上图称为频率分布直方图,其中横轴表 示月均用水量,纵轴表示频率/组距. 月均用水量/t频率 组距 0.5 0.4 0.3 0.2 0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率 组距知识探究(二):频率分布直方图 思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少?月均用水量/t频率 组距 0.5 0.4 0.3 0.2 0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积=

8、频率各小长方形的面积之和=1频率分布直方图特点:非常直观地表明 了样本数据的分布情况,使我们能够看 到频率分布表中看不太清楚的数据模式 ,但原始数据不能在图中表示出来.月均用水量/t频率 组距 0.5 0.4 0.3 0.2 0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;月均用水量/t频率 组距 0.5 0.4 0.3 0.2 0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对

9、称性等.图形说明问题:一般地,频率分布直方图的作图步骤第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点 ,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与 组距的商为高,分别画出各组对应的 小长方形.频率分布直方图作法的讨论 为了更加细致地分析样本的频率分 布以估计总体的分布,组数是不是 越多越好?影响组数与组距的因素 因素1:样本容量的大小; 因素2:原始数据的精细程度; 当样本容量不超过100时,常分成5-12组。 这是由统计经验获得的。理论迁移 例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34

10、,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在3252岁的知识分子所占的比例 约是多少.(1)极差为67-28=39,取组距为5,分为8组 .分 组 频数 频率27,32) 3 0.0632,37) 3 0.0637,42) 9 0.1842,47) 16 0.3247,52) 7 0.1452,57) 5 0.1057,

11、62) 4 0.0862,67) 3 0.06合 计 50 1.00样本频率分布表:(2)样本频率分布直方图:年龄0.06 0.05 0.04 0.03 0.02 0.0127 32 37 42 47 52 57 62 67频率 组距O(3)因为0.06+0.18+0.32+0.14=0.7 , 故年龄在3252岁的知识分子约 占70%.90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036例2:为了了解高一学生 的体能情况,某校抽取部分学 生进行一分钟跳绳次数次测试 ,将所得数据整理后,画出频 率分布

12、直方图(如图),图中从 左到右各小长方形面积之比为 2:4:17:15:9:3,第二小 组频数为12. (1)第二小组的频率是多少? 样本容量是多少? (2)若次数在110以上(含110 次)为达标,试估计该学校全 体高一学生的达标率是多少?频率分布直方图如下:月均用 水量/t频率组距0.50.5 1 1.522.5 33.5 44.5连接频率分布直方图中 各小长方形上端的中点 ,得到频率分布折线图0.4 0.3 0.2 0.1知识探究(三):频率分布折线图 总体密度曲线频率组距月均用 水量/t ab(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。当样本容量无限增大

13、,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线总体密 度曲线总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎 叶 图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39(2)乙运动员得分: 49,24,12,31,50,31,

14、44,36,15,37,25,36,39注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的 个位数。甲乙0 1 2 3 4 58 463 368 389125 54 16167 9 49 0茎叶图当样本数据较少时,用茎叶图表 示数据的效果较好,它不但可以 保留所有的信息,而且 可以随时 记录,给数据的记录和表示都方 便。练习:某中学高一(2)班甲,乙两 名同学自高中以来每场数学考试成 绩情况如下:甲的得分:95,81,75,91,86, 89,71,65,76,88,94乙的得分:83,86,93,99,88, 96,98,98,79,85,97画出两人数学成绩茎叶图,请根据 茎叶图对两人的成绩进行比较。小 结图形 优点 缺点频率分 布直方 图1)易表示大量数据 2)直观地表明分布 的情况丢失一些信 息茎叶图1)无信息损失 2)随时方便记录只能表示容 量较小的数 据课堂小结表示样本分布的方法:(1)频率分布表(2)频率分布图(包括直方图和条形图)(3)频率分布折线图(4)茎叶图1.频率分布表表示样本的分布的方法:分组个数累计频数频率频率/组距产品尺寸(mm)2.频率分布直方图样本频率分布中, 当样本容量无限增 大,组距无限缩小样本频率分布直方图接近 于一条光滑曲线总体 密

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号