2.2 总体分布的估计

上传人:豆浆 文档编号:52419837 上传时间:2018-08-21 格式:PPT 页数:30 大小:674KB
返回 下载 相关 举报
2.2 总体分布的估计_第1页
第1页 / 共30页
2.2 总体分布的估计_第2页
第2页 / 共30页
2.2 总体分布的估计_第3页
第3页 / 共30页
2.2 总体分布的估计_第4页
第4页 / 共30页
2.2 总体分布的估计_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《2.2 总体分布的估计》由会员分享,可在线阅读,更多相关《2.2 总体分布的估计(30页珍藏版)》请在金锄头文库上搜索。

1、统计的基本思想方法:根据样本的情况去估计总体的相应情况. 统计的核心问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分 析, 对总体的情况作出推断.国际奥委会2003年6月29日决定,2008年北京 奥运会举办的日期比原定日期推迟两周,改在8月 8日至8月24日举行原因是7月末8月初北京地区 得气温高于8月中下旬下表是随机抽取的近年来北京地区7月25日至 8月24日的日最高气温,得到如下样本(单位:C)7月25日 至8月10 日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.332.5 34.6 33.0 30.8 31.0 28.6

2、 31.5 28.88月8日至 8月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3l怎样通过上表中的数据,分析比较两时间段的高温(33)状 况呢?问题引入:1.频数与频率频数是指一组数据中,某范围内的数据出现 的次数;把频数除以数据的总个数,就得到频率.2.频率分布表当总体很大或不便于获得时,可以用样本的 频率分布估计总体的频率分布.我们把反映总体 频率分布的表格称为频率分布表.7月25日至 8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7

3、 33.7 33.332.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 8月8日至8 月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3时间时间总总天数高温天数频频率7月25日至8月10日17110.647 8月8日至8月24日1720.118频率分布表:3.频率分布条形图时间时间总总天数高温天数频频率7月25日至8月10日17110.647 8月8日至8月24日1720.118 各长方形长条的宽度要相同 . 相邻长条的间距要适当. 长方形长条

4、的高度表示取各 值的频率.0.10.20.30.40.50.60.77/25-8/10时间频率8/8-8/24由此可得:近年来北京地区7月25日至8月10日 的高温天气的频率明显高于8月8日至8月24日.我国是世界上严重缺水的国 家之一,城市缺水问题较为 突出,某市政府为了节约生 活用水,计划在本市试行居 民生活用水定额管理,即确 定一个居民月用水量标准a ,用水量不超过a的部分按 平价收费,超出a的部分按 议价收费。如果希望大部分 居民的日常生活不受影响, 那么标准a定为多少比较合 理呢 ?探究:你认为,为了较为 合理地确定出这个 标准,需要做哪些 工作? 我国是世界上严重缺水的国 家之一,

5、城市缺水问题较为 突出,某市政府为了节约生 活用水,计划在本市试行居 民生活用水定额管理,即确 定一个居民月用水量标准a ,用水量不超过a的部分按 平价收费,超出a的部分按 议价收费。如果希望大部分 居民的日常生活不受影响, 那么标准a定为多少比较合 理呢 ?探究:采用抽样调查的方 式获得样本数据 分析样本数据来估 计全市居民用水量的 分布情况下表给出100位居民的月均用水量表分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数 据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利 用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数 据的新方式讨论:如何分

6、 析数据?根据这些数据 你能得出用水 量其他信息吗 ?为此我们要对这些数据进行整理与分析一频率分布的概念: 频率分布是指一个样本数据在各个小范围内 所占比例的大小。一般用频率分布直方图反 映样本的频率分布 二画频率分布直方图其一般步骤为 (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1 第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常分成512

7、组.为方便组距的选择应力求”取整”. 本题如果组距为0.5(t). 则 第三步: 将数据分组:( 给出组的界限) 所以将数据分成9组较合适. 0, 0.5), 0.5, 1), 1, 1.5),4, 4.5) 共9组. 第四步: 列频率分布表. 分组组频频数频频率频频率/组组距 0-0.5)4 0.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2 合计计100组距=0.5 0.040.080.080.160.30.150.440.22 0.250.512.000.020.040.040.080.10.30.150

8、.0500.10.20.30.40.50.60.5 1 1.5 2 2.5 3 3.5 4 4.5第 五 步 : 画 出 频 率 分 布 直 方 图 . 频率/组距 月均用水量/t (组距=0.5) 0.080.160.30.440.50.30.10.080.04小长方形的面 积=?小长方形的面 积总和=?月均用水量最 多的在哪个区 间?探究:同样一组数据,如果组距不同,横轴、纵轴 的单位不同,得到的图的形状也会不同.不同的形 状给人以不同的印象,这种印象有时会影响我们 对总体的判断.分别以1和0.1为组距重新作图,然 后谈谈你对图的印象.从图中我们可以看到,月均 用水量在区间2,2.5)内的

9、 居民最多,在1.5,2)内次 之,大部分居民的月均用 水量都在1,3)之间.直方图能够很容易地表示大量数据,非常直观地 表明分布的形状,使我们能够看到分布表中看不清楚 的数据模式,但是直观图也丢失了一些信息,例如, 原始数据不能在图中表示出了.频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:两者表示内容相同.思考:频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别?纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率;频率分布直方图的纵轴(长方形的高)表示频率与组距 的比值.其相应组距上的频率等于该组距上长方形的面积.S1 计算数据中最大值与最小值

10、的差(极差),确定全 距(指整个取值区间的长度) S2 根据全距,决定组数和组距(分成的区间的长度). S3 分组:通常对组内数据所在区间取左闭右开区间, 最后一组取闭区间. S4 登记频数,计算频率,列出频率分布表.算法:1.频率分布表S1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示“频率组距”; S2 把横轴分为若干段,每一线段对应一个组的组距, S3 以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率 这些矩形就构成了频率分布直方图 所有矩形的面积和为1 算法:2.频率分布直方图图形的意义:频率分布直方图中各小长 方形

11、的面积表示什么?各小长方形的面 积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率 组距 0.5 0.4 0.3 0.2 0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率 组距频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边 的中点顺次连结起来,就得到一条折线,我们称这条 折线为本组数据的频率折线图练习:投掷一枚均匀骰子44次的记录是:32415134565 42531341451 63312426346 61622526543现对这些数据进行整理,试画出频数分布直方图 第一步:写出样本可能出现的一切数值,即: 1,2,3

12、,4,5,6 共6个数(数据分组)第二步:列出频率分布表:样本 频数778877频率0.160.160.180.180.160.16组距=1第三步: 画频率分布直方图小结: 画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整)第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)第五步: 画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.) 组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12

13、组。频率折线图的优点是它反映了数据的变化趋势如果 将样本容量取得足够大,分组的组距取得足够小,则 这条折线将趋于一条曲线,我们称这一曲线为总体分 布的密度曲线总体密度曲线总体在区间 内取值的概率某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50 12345叶:表示个位数字茎:表示十位数字茎叶图2545166794901从这张图可以粗 略地看出,该运 动员平均得分及 中位数、众数都 在20到40之间, 且分布较对称, 集中程度高,说 明其发挥比较稳 定茎叶图的画法:将所有的两位数的十位数字作为“茎”,个位 数字作为“叶”,茎相

14、同者共用一个茎,茎按从小 到大的顺序从上向下列出,共茎的叶一般按从大 到小(或从小到大)的顺序同行列出茎叶图的优缺点:优点是所有的信息都可以从茎叶图中得到, 便于记录和表示但茎叶图表示三位或三位以上 的数据时不够方便 例甲、乙两篮篮球运动员动员 在上赛赛季 每场场比赛赛的得分如下,试试比较这较这 两位 运动员动员 的得分水平甲 12,15,24,25,31,31, 36,36,37,39,44,49,50 乙 8,13,14,16,23,26, 28,33,38,39,51解:画出两人得分的茎叶图; 从这个茎叶图可以看出甲运动员的得 分大致对称,平均得分及中位数、众 数都是多分;乙运动员的得分除 一个外,也大致对称,平均得分 及中位数、众数都是多分,因此 甲运动员发挥比较稳定,总体得分情 况比乙好 练习: 1.右面是甲、 乙两名运动员动员 某赛赛季一些场场 次得分的茎叶 图图,据图图可知 ( )甲 0 1 2 3 4 5乙 8 247 199 36 250 32 875421 944 1AA甲运动员的成绩好于乙运动员 B乙运动员的成绩好于甲运动员 C甲、乙两名运动员动员 的成绩绩没有明显显的差异 D甲运动员动员 的最低得分为为0分从一个养鱼池中捕得m条 鱼,做上记号后放入池中, 数日 后又捕得n条鱼,其中k条有记 号,估计池中有鱼多少条?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号