用样本的频率分布估计总体分布(上课)ppt课件

上传人:我*** 文档编号:149206603 上传时间:2020-10-25 格式:PPT 页数:52 大小:739KB
返回 下载 相关 举报
用样本的频率分布估计总体分布(上课)ppt课件_第1页
第1页 / 共52页
用样本的频率分布估计总体分布(上课)ppt课件_第2页
第2页 / 共52页
用样本的频率分布估计总体分布(上课)ppt课件_第3页
第3页 / 共52页
用样本的频率分布估计总体分布(上课)ppt课件_第4页
第4页 / 共52页
用样本的频率分布估计总体分布(上课)ppt课件_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《用样本的频率分布估计总体分布(上课)ppt课件》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体分布(上课)ppt课件(52页珍藏版)》请在金锄头文库上搜索。

1、用样本的频率分布估计总体分布 (一),(1)统计的核心问题:,如何根据样本的情况对总体的情况作出推断,复习引入:,简单随机抽样 系统抽样 分层抽样,(3)通过抽样方法收集数据的目的是什么?,从中寻找所包含的信息,用样本去估计总体,(2)随机抽样的几种常用方法 :,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?,探究:,你认为,为了较为合理地确定出这个标准,需要做哪些工作?

2、,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?,探究:,采用抽样调查的方式获得样本数据 分析样本数据来估计全市居民用水量的分布情况,下表给出100位居民的月均用水量表,讨论:如何分析数据?,根据这些数据你能得出用水量其他信息吗?,为此我们要对这些数据进行整理与分析,我们很难从随意记录的数据中直接看出规律,为此,我们要对数据进行整理与分析.,分析数据的方法:,1、用图将它

3、们画出来,,2、用紧凑的表格改变数据的排列方式.,目的:一是从数据中提取信息,二是利用图形传递信息.,目的:通过改变数据的构成形式,为我们提供解释数据的新方式.,1.画频率分布直方图其一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图,分析数据的具体做法:,第一步: 求极差: (数据组中最大值与最小值的差距),最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1,第二步: 决定组距与组数: (强调取整),当样本容量不超过100时, 按照数据的多少, 常分成512组. 为方便组距

4、的选择应力求“取整”. 本题如果组距为0.5(t). 则,第三步: 将数据分组:( 给出组的界限),所以将数据分成9组较合适.,0, 0.5), 0.5, 1), 1, 1.5),4, 4.5 共9组.,第四步: 列频率分布表.,组距=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.3,0.15,0.05,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,5、画频率分布直方图,小长方形的面积总和=?,月均用水量最多的在哪个区间?,你

5、能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,问题 如果当地政府希望使85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?,问题 你认为3吨这个标准一定能够保证80以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?,问题:将组距确定为1,作出教材P66页 居民月均用水量的频率分布直方图,问题:谈谈两种组距下,你对

6、图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,问题 你认为频率分布直方图的优缺点是什么?,练 习:,1.有一个容量为50的样本数据的分组的频数如下:,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.

7、5, 24.5)的百分比是多少?,解:组距为3,分组 频数 频率 频率/ 组距,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,0.06 0.16 0.18 0.22 0.20 0.10 0.08,0.020 0.053 0.060 0.073 0.067 0.033 0.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,2.某地区为了了解知识分子的年龄结构,

8、随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在3252岁的知识分子所占的比例约是多少.,(1)极差为67-28=39,取组距为5,分为8组.,分 组 频数 频率 27,32) 3 0.06 32,37) 3 0.06 37,42)

9、 9 0.18 42,47) 16 0.32 47,52) 7 0.14 52,57) 5 0.10 57,62) 4 0.08 62,67) 3 0.06 合 计 50 1.00,样本频率分布表:,(2)样本频率分布直方图:,(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在3252岁的知识分子约占70%.,小结: 画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整) 第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频率/组距) 第五步: 画频率分布直方图(在频率

10、分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.),组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。,注意,(2)纵坐标为:,用样本的频率分布估计总体分布 (二),一.复习回顾:,绘制频率分布直方图有哪几个步骤呢?,复习练习:,为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第三小组频数为51. (1)第三小组的频率是多少?样本容量是多少?,0.34 150,频率分布直方图如下:,连接频率分布直

11、方图中各小长方形上端的中点,得到频率分布折线图,二.讲解新课:,在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.,总体密度曲线:,1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?,思考,1. 不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的,实际上,尽管有些总体密度曲线是客观存在的,但是在实际使用过程中我们并不知道它的具体

12、表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,因此不能简单的由样本的频率分布折线图得到准确的总体密度曲线.,2.图中阴影部分的面积表示什么?,2.总体在范围(a,b)内取值的百分比,例:NBA某赛季甲、乙两名篮球运动员每场比赛的得分的原始纪录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较,问题二:用上次

13、课所学的制作样本的频率分布直方图来分析好吗?甲:13,51,23,8,26,38,16,33,14,28,39;乙:49,24,12,31,50,31,44,36,15,37,25,36,39.,当数据比较少时,用频率分布直方图反而不方便,简化制图格式和步骤,得到新的统计制图方法:,甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.,茎叶图,茎叶图:顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数

14、.,2.如何通过分析茎叶图了解总体?,主要从对称性,中位数(体现成绩好坏), 稳定性(即集中程度)来分析,分析:甲得分除51分外大致对称,乙基本上也对称。 甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥 更稳定,问题三:和直方图比较,茎叶图有什么特点?,茎叶图不仅能保留原始数据,而且能够展示数据的分布情况 。,思考: 数据大于两位数的整数时又如何选茎,叶?,数据为小数时又如何选茎,叶?,结论:1当数据为整数时:通常个位数字在叶上, 其他位数在茎上(一位数时,茎为0),2当数据为小数时:通常小数部分在叶上, 整数部分在茎上,甲的茎叶图画

15、法,也可以画一组数据的茎叶图,竖线左边为茎, 右边为叶。,两组数据以上也可以分别画在一张图上,但没有两 组数据画一起比较起来更那么直观、清晰。,0 8 1 3 6 4 2 3 6 8 3 3 8 9 4 5 1,茎,叶,画茎叶图的步骤:,1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十 位上的数字,叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右) 侧; 3.将各个数据的叶按大小次序 写在其茎右(左)侧.,优点:1.即茎叶图保留了原始数据并展示了数据的分布情况。 2.茎叶图可以在比赛时随时记录,方便记录与表示。,缺点:当样本数据较多时,茎叶图就显得

16、不方便,3.茎叶图的优缺点,练习1:,右面是甲、 乙两名运动员 某赛季一些场 次得分的茎叶 图,据图可知 ( ),A,A甲运动员的成绩好于乙运动员 B乙运动员的成绩好于甲运动员,C甲、乙两名运动员的成绩没有明显的差异 D甲运动员的最低得分为0分,练习2.,下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:,甲,乙,( 1 ) 甲乙两名队员的最高得分各是多少?他们的中位数和众数各是多少?,( 2 ) 哪名运动员的成绩好一些?,( 1 ) 甲运动员的最高得分为51分 ,中位数为36,众数为44. 乙运动员的最高分为52分,中位数为25,众数为29.,( 2 ) 甲运动员的成绩好于乙运动员 .,练习3:,某次运动会甲乙两名射击运动员的成绩(环数) 如下: 甲:9.4,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号