用样本的频率分布总体的分布

上传人:ji****72 文档编号:35926811 上传时间:2018-03-22 格式:DOC 页数:6 大小:1.42MB
返回 下载 相关 举报
用样本的频率分布总体的分布_第1页
第1页 / 共6页
用样本的频率分布总体的分布_第2页
第2页 / 共6页
用样本的频率分布总体的分布_第3页
第3页 / 共6页
用样本的频率分布总体的分布_第4页
第4页 / 共6页
用样本的频率分布总体的分布_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《用样本的频率分布总体的分布》由会员分享,可在线阅读,更多相关《用样本的频率分布总体的分布(6页珍藏版)》请在金锄头文库上搜索。

1、221 用样本的频率分布估计总体的分布用样本的频率分布估计总体的分布荣成二中荣成二中 宋海燕宋海燕目的要求目的要求通过实例体会分布的意义和作用,在表示数据的过程中,学会列出频率分布表、画 频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。教学过程教学过程1实例引课实例引课为了解某地区女中学生的身体发育情况,不仅要了解其平均身高,还要了解身高在 哪个范围内的学生多,哪个范围内的学生少 为了解某次考试成绩,不仅应知道平均成绩,还应知道 90 分以上占多少,80 分90 分占多少,不及格占多少等 要解决上面的两个问题,需要从总体中得到一个包含大量数据的样本,并且把这些 数据形成频率分布,就可以

2、比较清楚地看出样本数据的特征,从而估计总体的分布情况。2引出课题:用样本的频率分布估计总体的分布引出课题:用样本的频率分布估计总体的分布看下面的例子 某钢铁加工厂生产内径为 2540mm 的钢管,为了掌握产品的生产状况,需要定期 对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用 随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的 100 件钢 管进行检测,把这 100 件钢管的质量分布情况作为总体的质量分布情况来看待。根据规 定,钢管内径的尺寸在区间 25.32525.475 内为优等品,我们特别希望知道所有生产的 钢管中优等品所占的比例,这时就可

3、以用样本的分布情况估计总体的分布情况。 下面的数据是一次抽样中的 100 件钢管的内径尺寸:(幻灯示) 25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37 25.35 25

4、.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.40 25

5、.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39上面的 100 个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用 统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方 图,步骤如下: (1)计算级差(一组数据中最大值与最小值的差)25.2625.240.32 (2)决定组距与组数(样本容量不超过 100 时,组数常分为 512 组) 如果组距定为 0.03,那么级差/组距0.32/0.0310 2/3 于是应将样本数据分成 11 组(组距还可以定为其他的数值)(3)决定分点将第 1 组的起点定为 25

6、.235,组距为 0.03,这样所分的 11 个组是:25.235,25.265 25.265,25.295 (4)列频率分布表分组个数累计频数频率25.23525.265110.0125.26525.295220.0225.29525.325550.0525.32525.35512120.1225.35525.38518180.1825.38525.41525250.2525.41525.44516160.1625.44525.47513130.1325.47525.505440.0425.50525.535220.0225.53525.565220.02合计1001001.00(5)绘制频

7、率分布直方图注:(1)小长方形的面积组距频率组距频率 各长方形的面积总和等于 1 (2)从频率分布表或频率分布直方图容易看出,优等品所占的比例等于 0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有 84%的优等品。 (3)用样本的频率分布估计总体的分布时,要使样本能够很好的反映总体的特性,必须 随机抽样。由于抽样的随机性,可以想到,如果随机抽取另外一个容量为 100 的样本, 所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似 地看作总体的分布。 (4)从频率分布直方图可以清楚的看出数据分布的总体态势,但是直方图本身得不出原

8、 始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 3频率分布折线图频率分布折线图 把频率分布直方图各个长方形上边的中点用线段连接起来,就得到分布折线图。4总体密度曲线总体密度曲线 频率分布直方图表明了所抽取的 100 件产品中,尺寸落在各个小组内的频率大 小样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概 率设想样本容量无限增大,分组的组距无限缩小,则频率分布直方图就会无限接近于 一条光滑曲线总体密度曲线它反映了总体在各个范围内取值的概率总体密度曲 线能够更好的反映总体在各个范围内的百分比,能够提供更准确的信息。根据这条曲线, 可求出总体在区间(

9、a,b)内取值的概率等于总体密度曲线,直线 x=a,x=b 及 x 轴所围图 形的面积5 5茎叶图茎叶图 常用的统计图表还有茎叶图,下面的例子就是用茎叶图表示数据。 例:某赛季甲、乙两名篮球运动员每场比赛的得分情况如下: 甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。乙的得分:8,13,14,16,23,26,28,33,38,39,51。注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数字 从上面这个茎叶图上可以看出,甲运动员的得分情况是大致对称的,中位数是 36;乙 运动员的得分情况除一个特殊得分外,也大致对称,中位数是 26

10、。因此甲运动员的发挥比 较稳定,总体得分情况比乙运动员好。 用茎叶图表示数据有两个突出的优点,一是从统计图上没有原始信息的损失,所有的 数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛是随时记录,方便记录与表示。 但茎叶图只便于表示两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个 以上的记录),但没有表示两个记录那么直观、清晰。 6 6课堂练习课堂练习 1)、对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( ) (A)频率分布直方图与总体密度曲线无关 (B)频率分布直方图就是总体密度曲线 (C)样本容量很大的频率分布直方图就是总体密度曲线 (D)如果样本容量无限增

11、大,分组的组距无限减小,那么频率分布直方图就会无限接近于 总体密度曲线 2)、在用样本频率估计总体分布的过程中,下列说法中正确的是( ) (A)总体容量越大,估计越精确 (B)总体容量越小,估计越精确 (C)样本容量越大,估计越精确 (D)样本容量越小,估计越精确 3)、10 个小球分别编有号码 1,2,3,4,其中 1 号球 4 个,2 号球 2 个,3 号球 3 个, 4 号球 1 个,数 0.4 是指 1 号球占总体分布的( ) (A)频数 (B)概率 (C)频率 (D)累计频率 4)、已知样本: 12 7 11 12 11 12 10 10 9 8 13 12 10 9 6 11 8

12、9 8 10 那么频率为 0.25 的样本的范围 是( )(A) (B) (C) (D) 5)、频率分布直方图中,小长方体的面积等于( ) (A)相应各组的频数 (B)相应各组的频率 (C)组数 (D)组距 6)、在总体密度曲线中,总体在区间(a,b)内取值的概率就是直线 _、_、_和总体密度曲线围成的图形的面积. 7)、对 100 位大学毕业生在该年七月份求职录取情况调查结果如下:20 人录取在行政 机关,31 人录取在公司,3 人录取在银行,18 人录取在学校,其余的还在求职中.那么七0 1 2 3 4 58 34 6 36 8 38 9152 54 97661 1 94 0甲乙月份这 1

13、00 位大学生还未被录取的概率为_. 8)、一个容量为 n 的样本分成若干组,已知某组的频数和频率分别为 30 和 0.25,则n=_.9)分 组 频 数 频 率1075, 1085)31085, 1095)91095, 1105)131105, 1115)161115, 1125)261125, 1135)201135, 1145)71145, 1155)41155, 1165)2合 计100(1)完成上面的频率分布表(2)根据上表,画出频率分布直方图(3)根据上表,估计数据落在1095,1135)范围内的概率约为多少?解:(1)(2)略(3)数据落在1095,1135范围的频率为 013+016 十 026+020 落在1095,1135内的概率约为 07510)教科书第 67 页练习 B 第 2、3 题 7 7归纳小结归纳小结 获得样本的频率分布的步骤: (1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表; (5)绘制频率分布直方图. 图形优点缺点频率分布直方图1)易表示大量数据 2)直观的反映分布的情况都是一些信息茎叶图1)无信息损失 2)随时记录,方便记录和只能处理样本容量较小数据表示8 8布置做业布置做业 教科书第 69 页练习 A 第 3、4 题

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号