用样本估计总体(一)

上传人:夏** 文档编号:585805178 上传时间:2024-09-03 格式:PPT 页数:29 大小:1.16MB
返回 下载 相关 举报
用样本估计总体(一)_第1页
第1页 / 共29页
用样本估计总体(一)_第2页
第2页 / 共29页
用样本估计总体(一)_第3页
第3页 / 共29页
用样本估计总体(一)_第4页
第4页 / 共29页
用样本估计总体(一)_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《用样本估计总体(一)》由会员分享,可在线阅读,更多相关《用样本估计总体(一)(29页珍藏版)》请在金锄头文库上搜索。

1、2.2.1 用样本的频率分布估计总体分布探究探究:我国是世界上严重缺水的我国是世界上严重缺水的 国家之一,城市国家之一,城市缺水问题较为突出。某市政府为了节约用缺水问题较为突出。某市政府为了节约用水,计划在水,计划在 本市试行居民生活用水定额管本市试行居民生活用水定额管理,即确定一个居民月用水量标准理,即确定一个居民月用水量标准a,用水用水量不超过量不超过a的按平价收费,超过的按平价收费,超过 a的按议价的按议价收费。如果希望大部分居民的收费。如果希望大部分居民的 日常生活不日常生活不受影响,那么标准受影响,那么标准a定为多少比较合理?你定为多少比较合理?你认为,为了较为合理地确定出这个标准,

2、认为,为了较为合理地确定出这个标准,需要做什么工作?需要做什么工作?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?从上面这些数字,我们很容易发现的居民的月均用水量的最小值从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是是 0.2 t,最大值是最大值是4.3 t.其他在其他在 0.2至至4.3之间。很难再发现其他信息。我们之间。很难再发现其他信息。我们很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据进行整理与分析。进行整理与分析。表表21 100位居民的月均用水量位居民的月均用水量 (

3、单位(单位 :t ) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2

4、.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2n1、求极差求极差(即一组数据中最大值与即一组数据中最大值与最小值的差最小值的差)n 这组数据的变动范围这组数据的变动范围4.3-0.2=4.12.2.决定组距与组数决定组距与组数n将一批数据分组,目的是要描述数据分布的规律将一批数据分组,目的是要描述数据分布的规律, ,要根据要根据数据的多少来确定分组的数目数据的多少来确定分组的数目. .一般来说一般来说, ,数据越多数据越多, ,分的分

5、的组也越多组也越多. .n组距是指每个小组的两个端点之间的距离组距是指每个小组的两个端点之间的距离n极差,组距,组数之间有如下关系:极差,组距,组数之间有如下关系: 1. 1. 若若 为整数,则为整数,则 = =组数组数 2 2 若若 不是整数,则不是整数,则 +1=+1=组组数数 xx表示不大于表示不大于x x的整数的整数3.将数据分组将数据分组以组距将数据分组,分组时,各组均为前闭后开区间。以组距将数据分组,分组时,各组均为前闭后开区间。例如例如. = =8.2组数组数= +1=9因此将数据以组距因此将数据以组距0.5组,可以分成组,可以分成9组:组: 0 , 0.5), 0.5 ,1),

6、),, 4 , 4.5)。n4.列频率分布表列频率分布表n 数据落在各小组内的数据的个数叫数据落在各小组内的数据的个数叫做做频数频数n 各小组的频数与数据总数的比值叫各小组的频数与数据总数的比值叫做这个小组的做这个小组的频率频率5、画出、画出频率分布直方图频率分布直方图。1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列

7、出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分组 频数累计频数累计 频数频数 频率频率 0 , 0.5) 4 0.04 0.5 , 1) 8 0.08 1 , 1.5) 15 0.15 1.5 , 2) 22 0.22 2 , 2.5) 25 0.25

8、 2.5 , 3) 14 0.14 3 , 3.5) 6 0.06 3.5 , 4) 4 0.04 4 , 4.5) 2 0.02 合计 100 1.00频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积积=?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5频率分布直方图如下频率分布直方图如下:小长方形的面小长方形的面积总和积总和=?注:小长方形的面积组距注:小长方形的面积组距频率频率/组距

9、频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1。频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5直方图有那些直方图有那些优点和缺点优点和缺点?00.511.522.53 3.5 4 4.50.500.400.300.200.10频率频率/组距组距月均用水量月均用水

10、量 /t注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1。练练 习习1.有一个容量为有一个容量为50的样本数据分组的频数如下的样本数据分组的频数如下12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的百分比是多少

11、)的百分比是多少? 解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/ 组距组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.0701、求极差、求极差(即一组数据中最大值与最小值的差即一

12、组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)小结小结:画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。练习练习. 一

13、个容量为一个容量为100的样本,数据的分组的样本,数据的分组和各组的一些相关信息如下:和各组的一些相关信息如下:(1)完成上表中每一行的两个空格;)完成上表中每一行的两个空格;(2)画出频率分布直方图;)画出频率分布直方图;(3)根据累计频率分布图估计,总体中)根据累计频率分布图估计,总体中小于小于21的样本数据大约占多大的百分比?的样本数据大约占多大的百分比? (1)补全后的频率分布表如下:)补全后的频率分布表如下: 0.060.210.160.060.140.300.510.180.850.950.0581618105(2) 频率分布直方图:频率分布直方图:7.总体密度曲线总体密度曲线 总

14、体密度曲线反映了总体在各个范围内的百分比,它能总体密度曲线反映了总体在各个范围内的百分比,它能 给我们提供更加精细的信息给我们提供更加精细的信息 例如,图中的阴影部分的面积,就是总体在区间(例如,图中的阴影部分的面积,就是总体在区间(a ,b) 内取值的百分比内取值的百分比1.不是任意总体都有密度曲线,不是任意总体都有密度曲线,当总体个数比较少或者数据的分布当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线过于离散不连续时,总体密度曲线都是不存在的都是不存在的n2.2.总体密度曲线与总体分布相互唯一确定,如总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到密度曲线。果总

15、体分布已知,就可以得到密度曲线。n3.3.在总体情况未知的情况下,可通过样本频率在总体情况未知的情况下,可通过样本频率折线近似估计得到密度曲线,样本容量越大,折线近似估计得到密度曲线,样本容量越大,估计越精确。但是不能通过样本数据准确地画估计越精确。但是不能通过样本数据准确地画出总体密度曲线。出总体密度曲线。 通过通过 茎是中间的数,表示得分的十位,叶是旁边的数。茎是中间的数,表示得分的十位,叶是旁边的数。分别表示两个人得分的个位数。得图如下:分别表示两个人得分的个位数。得图如下:8.茎叶图茎叶图画茎叶图的步骤画茎叶图的步骤n1 1 将每个数据分为茎(高位)和叶(低将每个数据分为茎(高位)和叶(低位)两部分位)两部分n2.2.将最小的茎和最大的茎之间的数按大将最小的茎和最大的茎之间的数按大小次序排成一列,写在中间。小次序排成一列,写在中间。n3 3 将各个数据的叶按大小次序写在其茎将各个数据的叶按大小次序写在其茎右(左右(左) ) 侧侧

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 劳务/用工合同

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号