用样本频率分布估计总体分布(1)

上传人:我** 文档编号:117887474 上传时间:2019-12-11 格式:PPT 页数:49 大小:1.61MB
返回 下载 相关 举报
用样本频率分布估计总体分布(1)_第1页
第1页 / 共49页
用样本频率分布估计总体分布(1)_第2页
第2页 / 共49页
用样本频率分布估计总体分布(1)_第3页
第3页 / 共49页
用样本频率分布估计总体分布(1)_第4页
第4页 / 共49页
用样本频率分布估计总体分布(1)_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《用样本频率分布估计总体分布(1)》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布(1)(49页珍藏版)》请在金锄头文库上搜索。

1、2.2.1用样本的频率分布 估计总体分布 频数: 在总体(或样本)中,某个个体出现的 次数叫做这个个体的频数。 频率: 某个个体的频数与总体(或样本)中所 含个体的数量的比叫做这个个体的频 率。 性质: 在总体(或样本)中,各个个体的频率 之和等于1。 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2

2、.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 通过抽样我们得到了100户居民的某年的月平均用水量 为了确定一个比较合理的标准a, 必须先了解全市居民的日常用水量 的分布情况。 通过抽样调查了解

3、居民的用水情况 。 列频数分布表和画频数分布直方图 1.求极差: 步骤: 4.3 - 0.2 = 4.1 2.决定组距与组数:组数= 4.1 0.5 = 8.2 组距 极差 = 3.将数据分组 0,0.5 ),0.5,1 ),4,4.5 列频数分布表和画频数分布直方图 步骤: 分组组频频数累计计(划记记 ) 频频数 0, 0.5) 0.5, 1) 1, 1.5) 1.5, 2) 2, 2.5) 2.5, 3) 3, 3.5) 3.5, 4) 4, 4.5 合计 频频数累计计(划记记 ) 正 正正正 正正正正丅 正正正正正 正正 正 丅 频频数 4 8 15 22 25 14 6 4 2 100

4、 4.画频数分布表 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频数(个) 月平均用水量(t) 27 24 21 18 16 13 9 6 3 0 5.画频数分布直方图 分组组频频数累计计(划记记 ) 频频数 0, 0.5)4 0.5, 1)正8 1, 1.5)正正正15 1.5, 2)正正正正丅22 2, 2.5)正正正正正25 2.5, 3)正正14 3, 3.5)正6 3.5, 4)4 4, 4.5丅2 合计100 分组组频频数累计计(划记记 ) 频频数 0, 0.5)4 0.5, 1)正8 1, 1.5)正正正15 1.5, 2)正正正正丅22 2, 2.5)正正正正正25

5、 2.5, 3)正正14 3, 3.5)正6 3.5, 4)4 4, 4.5丅2 合计100 频频率 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 分组组频频数累计计(划记记 ) 频频数 0, 0.5)4 0.5, 1)正8 1, 1.5)正正正15 1.5, 2)正正正正丅22 2, 2.5)正正正正正25 2.5, 3)正正14 3, 3.5)正6 3.5, 4)4 4, 4.5丅2 合计100 频频率频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 频率 月平均用水量/t 0.50

6、 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 分组组频频数累计计(划记记 ) 频频数 0, 0.5)4 0.5, 1)正8 1, 1.5)正正正15 1.5, 2)正正正正丅22 2, 2.5)正正正正正25 2.5, 3)正正14 3, 3.5)正6 3.5, 4)4 4, 4.5丅2 合计100 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 频频率/组组距 0.08 0.16 0.3 0.44 0.5 0.28 0.12 0.08 0.04 4.列频率分布表 频频率/组组距 频率

7、/组距 月平均用水量/t 0.50 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.画频率分布直方图 思考:各小长方 形的面积之和等 于多少? 分组组频频数累计计(划记记 ) 频频数 0, 0.5)4 0.5, 1)正8 1, 1.5)正正正15 1.5, 2)正正正正丅22 2, 2.5)正正正正正25 2.5, 3)正正14 3, 3.5)正6 3.5, 4)4 4, 4.5丅2 合计100 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 频频率/组组距频频率/组组距 0.08 0

8、.16 0.3 0.44 0.50 0.28 0.12 0.08 0.04 问题问题 5 总结 画频率分布直方图的操作步骤 1.求极差,即数据中最大值与最小值的差 2.决定组距与组数 组数=极差/组距 3.将数据分组, 通常对组内数值所在区间,取左闭右 开区间 , 最后一组取闭区间 4.登记频数,计算频率和频率组距 , 列出频率分布表 5.画出频率分布直方图(纵轴表示频率组距) 同样一组数据,如果组距不同,得到的图 的形状也会不同。 影响组数与组距的因素 因素1:样本容量的大小; 因素2:原始数据的精细程度; 当样本容量不超过100时,常分成512组。 这是由统计经验获得的。 频率/组距 月平

9、均用水量/t 0.50 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 分组组 0, 0.5) 0.5, 1) 1, 1.5) 1.5, 2) 2, 2.5) 2.5, 3) 3, 3.5) 3.5, 4) 4, 4.5 合计 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 思考:如果当地政府希望使85%以上的居民每月的 用水量不超出标准,根据频率分布表和频率分布直 方图,你能对制定月用水量标准提出建议吗? 频率/组距 月平均用水量/t 0.50 0.40 0.30 0.20 0.10 0

10、 0.5 1 1.5 2 2.5 3 3.5 4 4.5 分组组 0, 0.5) 0.5, 1) 1, 1.5) 1.5, 2) 2, 2.5) 2.5, 3) 3, 3.5) 3.5, 4) 4, 4.5 合计 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 分析:月用水量在3 t以上的居民所占的比例为6% +4%+2%=12%,即大约有12%的居民月用水量在3t以 上,88%的居民月用水量在3t以下. 因此,居民月 用水量标准定为3t是一个可以考虑的标准. 频率/组距 月平均用水量/t 0.50 0.40 0.30 0.20 0.10

11、0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 分组组 0, 0.5) 0.5, 1) 1, 1.5) 1.5, 2) 2, 2.5) 2.5, 3) 3, 3.5) 3.5, 4) 4, 4.5 合计 频频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 想一想:你认为3t这个标准一定能够保证85以 上的居民用水不超标吗?如果不一定,那么哪些 环节可能会导致结论的差别? 所得到的结论的统计意义 3t这个标准一定能保证85%以上的居民用水 不超标吗? 不一定! 原因1、样本只是总体的代表,并且具有随 机性,不同的样本所得到的频率分布表

12、和 直方图是不同的。 原因2、明年的用水情况与今年不可能完全 一样,但应该大致一样。 所得到的结论的统计意义 一般的,统计得到的结果,是对于总体较 为合理的估计或预测,但其误差应该控制 在合理的范围之内。 也正因为这样,统计结果的好坏,往往需 要进一步的评价,或通过理论方法的检验 ,或通过实际应用的检验。 频率分布表和频率分布直方图在带给 我们许多新的信息的同时,也丢失了 一些信息,如原始数据不能在分布表 和直方图中很好地体现出来。 频率分布直方图的优缺点是什么? 连接频率分布直方图中各小长方形上端的 中点,就得到频率分布折线图。 思考:上例的样本容量为100,如果增至1000,其频率 分布直

13、方图的情况会有什么变化? 假如增至10000呢? 分析:样本容量越大,这种估计越精确。但 随着样本容量的增加,作图时所分的组数增 加,组距减小,相应的频率折线图会越来越 接近于一条光滑曲线. 频率 组距 产品 尺寸 (mm) ab 当样本容量无限增大,分组的组距无限缩小,那么 频率分布直方图就会无限接近一条光滑曲线总体密 度曲线 区间 在总体内取值的概率 总体密度曲线 总体密度曲线 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。 总体密度曲线反映了总体在各个范

14、围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具. 总体密度曲线 思考:对于一个总体,如果存在总体密度曲线,这 条曲线是否惟一? 频率分布表、频率分布直方图和折线图的主要 作用是表示样本数据的分布情况,此外,我们还可 以用茎叶图来表示样本数据的分布情况. 由于样本是随机的,不同的样本得到的不同频率 分布折线图;即使对与同一样本,不同的分组情况得 到的也不同频率分布折线图。频率分布折线图是随着 样本容量和分组情况变化而变化的。 1、某赛季甲、乙两名篮球运动员每场比赛得 分的原始记录为: 甲运动员的得分:13 51 23 8 26 38 16 33 14 28 39 乙运动员

15、的得分:49 24 12 31 50 31 44 36 15 37 25 36 39 我们可以画出茎叶图,也就是中间的数表示十位数, 旁边的数表示两个人得分的个位数,就象一棵树的茎 与叶子一样,能更直观地看出这两个人的得分情况。 例题: 茎叶图 甲 乙 0 1 2 3 4 5 2 5 5 4 1 6 1 6 7 9 4 9 0 8 4 6 3 3 6 8 3 8 9 1 1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录 如下: (1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39 (2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 茎叶图 叶就是从茎的旁边 生长出来的数,表示得 分的个位数。 茎是指中间的一列 数,表示得分的十位 数 画茎叶图的步骤: 1.将每个数据分为茎(高位)和叶(低位)两部 分,在此例中,茎为十位上的数字,叶为个位上 的数字。 2.将最小茎和最大茎之间的数按大小次序排成一 列。 3.将各个数据的叶按读数次序(或按大小次序) 写在

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号