用样本的频率分布估计总体分布修改.ppt

上传人:枫** 文档编号:568555282 上传时间:2024-07-25 格式:PPT 页数:25 大小:1.11MB
返回 下载 相关 举报
用样本的频率分布估计总体分布修改.ppt_第1页
第1页 / 共25页
用样本的频率分布估计总体分布修改.ppt_第2页
第2页 / 共25页
用样本的频率分布估计总体分布修改.ppt_第3页
第3页 / 共25页
用样本的频率分布估计总体分布修改.ppt_第4页
第4页 / 共25页
用样本的频率分布估计总体分布修改.ppt_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《用样本的频率分布估计总体分布修改.ppt》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体分布修改.ppt(25页珍藏版)》请在金锄头文库上搜索。

1、 2.2.1 用样本的频率分布用样本的频率分布 估计总体分布估计总体分布问题提出问题提出1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通过样随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习即用样本估计总体,是我们需要进一步学习的内容的内容. .简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样. .频率:频率:频数与总体(或样本)中所含个体的数量之比频数与总体(或样本)中所含个体的数量之比叫叫这个个体的这个个体的

2、频率频率。复习回顾复习回顾频数:频数:在总体(或样本)中,某个个体出现的次数叫这在总体(或样本)中,某个个体出现的次数叫这个个体的个个体的频数频数。我国的缺水情况我国是世界上严重缺水的国家之一。如何节约用水?市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费,那么该如何比较合理的确定出这个标a?为了确定一个比较合理的标准a,必须先了解全市居民的日常用水量的分布情况。通过抽样调查了解居民的用水情况。 这100户用水量在0.2-4.3之间,除此之外我们很难得到其他信息,因此,我们必须对数据的潜在信息潜在信

3、息进行分析!通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量( (单位:单位:t) t) ,如下表:,如下表: 如何了解全县日常用水量的情况如何了解全县日常用水量的情况一一频率分布频率分布 样本中某数据(或数据组)的频数和样本容量的比,样本中某数据(或数据组)的频数和样本容量的比,叫做该数据的叫做该数据的频率频率。二二频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方图直方图样本频率分布折线图样本频率分布折线图 所有数据(或数

4、据组)的频数的分布变化规所有数据(或数据组)的频数的分布变化规律叫做律叫做样本的频率分布。样本的频率分布。0.10.20.30.40.50.60.7一级品一级品 二级品二级品产品产品频率频率三级品三级品次品次品样本频率分布的条形图样本频率分布的条形图1.求极差求极差:(样本数据组中最大值与最小值的差) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.12.决定组距与组数决定组距与组数: 当样本容量不超过当样本容量不超过100100时时, , 按照数据的多少按照数据的多少, , 常分成常分成5-125-12组组. .为为方便组距的选择应力求方便组距的选择应力求“取整取整”

5、. .本题如果组距为本题如果组距为0.5(t). 0.5(t). 则则 3.将数据分组将数据分组( 给出组的界限)取取左闭右开左闭右开区间区间 , 最后一组取闭区间最后一组取闭区间所以将数据分成9组较合适. 0, 0.5), 0.5, 1), 1, 1.5),4, 4.5 共9组. 三三画频率分布直方图其画频率分布直方图其一般步骤一般步骤为:为:(设组数(设组数k=极差极差组距,若组距,若k为整数,则组数为整数,则组数=k,否则,组数,否则,组数=k+1) 4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表分组分组频数频数频率频率频率频率/

6、组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)143-3.5)63.5-4)4 4-4.52合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.120.280.140.064.4.列频率分布表列频率分布表频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积组距组距频率

7、频率=组距组距频率频率= =0.080.30.160.50.440.280.080.120.04 分分 组组 频率频率 0,0.5) 0.04 0.5,1) 0.08 1,1.5) 0.15 1.5,2) 0.22 2,2.5) 0.25 2.5,3) 0.14 3,3.5) 0.06 3.5,4) 0.04 4,4.5 0.02 合合 计计 1.00即即频率分布直方图就以面积的形式反映了数据落在各个小频率分布直方图就以面积的形式反映了数据落在各个小 组的频率的大小。组的频率的大小。为什么为什么?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间?

8、 ?请大家阅读第请大家阅读第6868页页, ,直方图有直方图有哪些优点和缺哪些优点和缺点点? ?小长方形的面小长方形的面积积=?=?频率分布直方图的优缺点:频率分布直方图的优缺点:优点:优点:能够很容易表示大量数据,非常直观的表能够很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。楚的一些数据模式。缺点:缺点:虽可以大致估计出总体的分布情况,但不虽可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确度要求较高的情能保留原来的数据信息,在精确度要求较高的情况下不适用。况下不适用。频率频率/组距组距月平均

9、用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 探究:探究: 同样一组数据,如果组距不同,横轴、纵轴的单位同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以的印象,这种印象有时会影响我们对总体的判断。分别以1 1和和0.10.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。 3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只

10、是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。思考思考;如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的以上的居民每月的用水量不超出标准,根据频率分布表用水量不超出标准,根据频率分布表2-22-2和频率和频率分布直方图分布直方图2.2-12.2-1,你能对制定月用水量标准提,你能对制定月用水量标准提出建议吗出建议吗 ?频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率分布直方图是有样本决定

11、的,它会随频率分布直方图是有样本决定的,它会随着样本的变化而变化。着样本的变化而变化。根据频率和概率的关系,固定分组数,随根据频率和概率的关系,固定分组数,随着样本用量的增加,各个频率段会位定在着样本用量的增加,各个频率段会位定在总体的频率段上。总体的频率段上。随机性:随机性:规律性:规律性:频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点, ,得到得到频率分布折线图频率分布折线图频率频率组距组距月均用水量

12、月均用水量 (mm)ab 当样本容量无限增大,分组的组距无限缩小,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线总体密度曲线总体在区间总体在区间 内取值的百分比内取值的百分比S 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百百分分

13、比比;但但不不能能由由样样本本的的频频率率分分布布折折线线图图得得到到准准确确的总体密度曲线。的总体密度曲线。 总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的百分比的百分比, ,精确地反映了总体的分布规律。精确地反映了总体的分布规律。总体密度曲线总体密度曲线例题例题 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,37

14、37,4444,4545,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .(1)(1)极差为极差为67-28=

15、3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 2727,3232) 3 0.063 0.06 32 32,3737) 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,6767) 3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率

16、分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.1.已知样本已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为

17、那么频率为0.2范围的是范围的是 ( )A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组分组 频数频数 频率频率 5.57.5 2 0.1 7.59.5 6 0.3 9.511.5 8 0.411.513.5 4 0.2 合计合计 20 1.0D巩固练习巩固练习2如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为123,第2小组的频数为10,则抽取的学生人数为3.在育才中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图已知图中从左到右的第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.则第二小组的小长方形的高为()A0.04 B0.40 C10 D0.02540A4.为了解某地居民的月收入情况,一个社会调查机构调查了20000人,并根据所得数据画出样本的频率分布直方图如图现按月收入分层,用分层抽样的方法在这20000人中抽出200人作进一步调查,则月收入在1500,2000)(单位:元)的应抽取_人40课堂小结课堂小结通过本节课学习你有哪些收获? 作作 业业优化方案P85-86 (除4、9、10题),其中11、12为选做!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号