用样本的数字特征去估计总体

上传人:鲁** 文档编号:568843933 上传时间:2024-07-27 格式:PPT 页数:24 大小:283.50KB
返回 下载 相关 举报
用样本的数字特征去估计总体_第1页
第1页 / 共24页
用样本的数字特征去估计总体_第2页
第2页 / 共24页
用样本的数字特征去估计总体_第3页
第3页 / 共24页
用样本的数字特征去估计总体_第4页
第4页 / 共24页
用样本的数字特征去估计总体_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《用样本的数字特征去估计总体》由会员分享,可在线阅读,更多相关《用样本的数字特征去估计总体(24页珍藏版)》请在金锄头文库上搜索。

1、2.2 2.2 用样本估计总体用样本估计总体.2.1.2.1用样本的用样本的频率分布频率分布估计总体分布估计总体分布第一课时第一课时 1问题提出问题提出1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们基本特征,即用样本估计总体,是我们需要进一步学习的内容需要进一步学习的内容. .简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样. .2知识探究(一):频率分布表知识探究(一):频率分布

2、表 【问题】【问题】 我国是世界上严重缺水的国家之一,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不超过,用水量不超过a a的部分的部分按平价收费,超出按平价收费,超出a a的部分按议价收费的部分按议价收费. .通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的月均用水年的月均用水量如下表(单位:量如下表(单位:t t):):33.1 2.5 2

3、.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6

4、4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4

5、1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.245思考思考1 1:上述上述100100个数据中的最大值和最小值分别个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?是什么?由此说明样本数据的变化范围是什么?思考思考2 2:样本数据中的最大值和最小值的差称样本数据中的最大值和最小值的差

6、称为极差为极差. .如果将上述如果将上述100100个数据按组距为个数据按组距为0.50.5进行进行分组,那么这些数据共分为多少组?分组,那么这些数据共分为多少组? 0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.26思考思考3 3:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据个数据共分为共分为9 9组,各组数据的取值范围可以如何设定?组,各组数据的取值范围可以如何设定?思考思考4 4:如何统计上述如何统计上述100100个数据在各组中的频数个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些?如何计算样本数据在各组中

7、的频率?你能将这些数据用表格反映出来吗?数据用表格反映出来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.7 分分 组组 频数累计频数累计 频数频数 频率频率 0 0,0.50.5) 4 0.04 4 0.04 0.5 0.5,1 1) 正正 8 0.08 8 0.08 1 1,1.51.5) 正正 正正 正正 15 0.15 15 0.15 1.5 1.5,2 2) 正正 正正 正正 正正 22 0.22 22 0.22 2 2,2.52.5) 正正 正正 正正 正正 正正 25 0.25 25 0.25 2.5 2.5,3 3) 正

8、正 正正 14 0.14 14 0.14 3 3,3.53.5) 正正 一一 6 0.06 6 0.06 3.5 3.5,4 4) 4 0.04 4 0.04 4 4,4.5 2 0.024.5 2 0.02 合计合计 100 1.00 100 1.008思考思考5 5:上表称为样本数据的频率分布表,由此上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?里体现了一种什么统计思想? 用样本的频率分布估计总体分

9、布用样本的频率分布估计总体分布. .9思考思考6 6:如果市政府希望如果市政府希望85%85%左右的居民每月的用左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即居民月用水量标准(即a a的取值)有何建议?的取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t3t以下,可建议取以下,可建议取a=3.a=3. 思考思考7 7:在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上的以上的居民用水不超标吗?哪些环节可能会导致结论出现居民用水不超标吗?哪些环节可能会导致结论出现偏差?偏差?分

10、组时,组距的大小可能会导致结论出现偏差,实分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的践中,对统计结论是需要进行评价的. . 10思考思考8 8:对样本数据进行分组,其组数是由哪对样本数据进行分组,其组数是由哪些因素确定的?些因素确定的?思考思考9 9:对样本数据进行分组,组距的确定没有固定对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分的标准,组数太多或太少,都会影响我们了解数据的分布情况布情况. .数据分组的组数与样本容量有关,一般样本容数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多量越大,所分组数越多.

11、.按统计原理,若样本的容量为按统计原理,若样本的容量为n n,分组数一般在(,分组数一般在(1+3.3lgn1+3.3lgn)附近选取)附近选取. .当样本容量不当样本容量不超过超过100100时,按照数据的多少,常分成时,按照数据的多少,常分成5 51212组组. .若以若以0.10.1或或1.51.5为组距对上述为组距对上述100100个样本数据分组合适吗?个样本数据分组合适吗?11思考思考1010:一般地,列出一组样本数据的频率分布一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?表可以分哪几个步骤进行?第一步,求极差第一步,求极差. .(极差(极差= =样本数据中最大值与最小值

12、的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数. .(设(设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数否则,组数=k+1=k+1) 第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格. . (频数(频数= =样本数据落在各小组内的个数,样本数据落在各小组内的个数, 频率频率= =频数频数样本容量)样本容量)12知识探究(二):频率分布直方图知识探究(二):频率分布直方图 思考思考1 1:为了直观反映样本数据在各组中的为了直观反映样本数

13、据在各组中的分布情况,我们将上述频率分布表中的有关分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:信息用下面的图形表示: 月均用水量月均用水量/t/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O13上图称为上图称为频率分布直方图频率分布直方图,其中,其中横轴表示月均用横轴表示月均用水量水量,纵轴表示频率纵轴表示频率/ /组距组距. . 频率分布直方图中频率分布直方图中各小长方形的和高度在数量上有何特点?各小长方形的和高度在数量上有何特

14、点?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O宽度:组距宽度:组距高度:高度:频率频率组距组距14思考思考2 2:频率分布直方图中各小长方形的面频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少积表示什么?各小长方形的面积之和为多少?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O各小长方形的面积各小长方形的面积= =对应频率对应频率各小长方形的面积之和各小长方形的面积之和=1=115思考思考3

15、3:频率分布直方图非常直观地表明了样本频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示不太清楚的数据模式,但原始数据不能在图中表示出来出来. .你能根据上述频率分布直方图指出居民月均你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?用水量的一些数据特点吗?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O16(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,

16、而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等. .17思考思考4 4:样本数据的频率分布直方图是根据频率样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作分布表画出来的,一般地,频率分布直方图的作

17、图步骤如何?图步骤如何? 第一步,画平面直角坐标系第一步,画平面直角坐标系. . 第二步,在横轴上均匀标出各组分点,在纵轴第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度上标出单位长度. .第三步,以组距为宽,各组的频率与组距的商第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形为高,分别画出各组对应的小长方形. .18思考思考5 5:对一组给定的样本数据,频率分布直方对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以样本中,你能以1 1为组距画频率分布直方图吗?为组距画频率分布直

18、方图吗? 与分组数(或组距)及坐标系的单位长度有关与分组数(或组距)及坐标系的单位长度有关. .月均用水量月均用水量/t/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O O19理论迁移理论迁移 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444, 40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929

19、, 48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444, 42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767, 53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .20(1)(1)极差为极差为67-28=3967-28=39,取

20、组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 27 27,3232) 3 0.06 3 0.06 32 32,3737) 3 0.06 3 0.06 37 37,4242) 9 0.18 9 0.18 42 42,4747) 16 0.32 16 0.32 47 47,5252) 7 0.14 7 0.14 52 52,5757) 5 0.10 5 0.10 57 57,6262) 4 0.08 4 0.08 62 62,67 3 0.0667 3 0.06 合合 计计 50 1.00 50 1.00样本频率分布表:样本频率分布表:21(2 2)样本频率分

21、布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故故年龄在年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.22小结作业小结作业1.1.频率分布是指一个样本数据在各个小范围内所频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值

22、的频率分占比例的大小,总体分布是指总体取值的频率分布规律布规律. .我们通常用样本的频率分布表或频率分我们通常用样本的频率分布表或频率分布直方图去估计总体的分布布直方图去估计总体的分布. .2.2.频率分布表和频率分布直方图,是对相同数据的频率分布表和频率分布直方图,是对相同数据的两种不同表达方式两种不同表达方式. .用紧凑的表格改变数据的排列用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况方式和构成形式,可展示数据的分布情况. .通过作通过作图既可以从数据中提取信息,又可以利用图形传递图既可以从数据中提取信息,又可以利用图形传递信息信息. .233.3.样本数据的频率分布表和频率分布直方图,样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此的看到整个样本数据的频率分布情况,并由此估计总体的分布情况估计总体的分布情况. .作业:作业:P71P71练习:练习:1.1.(1 1). . P81P81习题习题2.2A2.2A组:组:2.2.24

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号