考点4,随机抽样与总体估计

上传人:豆浆 文档编号:752549 上传时间:2017-05-13 格式:DOC 页数:10 大小:449.50KB
返回 下载 相关 举报
考点4,随机抽样与总体估计_第1页
第1页 / 共10页
考点4,随机抽样与总体估计_第2页
第2页 / 共10页
考点4,随机抽样与总体估计_第3页
第3页 / 共10页
考点4,随机抽样与总体估计_第4页
第4页 / 共10页
考点4,随机抽样与总体估计_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《考点4,随机抽样与总体估计》由会员分享,可在线阅读,更多相关《考点4,随机抽样与总体估计(10页珍藏版)》请在金锄头文库上搜索。

1、考点四 随机抽样与总体估计考点要揽理解随机抽样的必要性和重要性。会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法。了解分布的意义与作用,会用频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点。理解样本数据标准差的意义和作用,会计算数据标准差。能从样本数据中提取基本的数字特征(如平均数、标准差) ,并作出合理的解释。会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。命题趋向随机抽样这一部分主要考查学生在应用问题中构造抽样模型、识别模型、选

2、择适当的抽样方法抽取样本。主要是以选择题和填空题为主,属于中低档题,重点考查分层抽样和系统抽样的计算。以选择题和填空题的形式考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用。在解答题中经常把频率分布问题与概率相结合命题,属于中低档题。备考策略系统掌握有关概念理解常见的抽样方法及它们之间的联系与区别一、随机抽样(一)简单随机抽样:设一个总体的个数为 .如果通过逐个抽取的方法从中抽N取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.实现简单随机抽样,常用抽签法和随机数表法.1.抽签法:先将总体中的所有个体(共有 个)编号(号码可从 1 到 ),并把号N码写在

3、形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取次, 就得到一个容量为 的样本.nn适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.2.随机数表法:第一步,将总体中的个体编号(要保证位数一致);第二步,选定开始的数字;第三步,获取样本号码.使用随机数表法时注意:当随机地选定开始读的数后,读数的方向可以向右,也可以向左、向上、向下等等.在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.

4、用简单随机抽样,从含有 个个体的总体中抽取一个容量为 的样本时,每次Nn抽取一个个体时任一个个体被抽到的概率为 ,在整个抽样过程中各个个体被N1抽到的概率为 .Nn(二)系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先制定的规则,从每一部分抽取 1 个个体,得到所需要的样本,这种抽样叫做系统抽样.系统抽样的步骤可概括为:1.将总体中的个体编号;2.将整个的编号进行分段.为将整个的编号进行分段,要确定分段的间隔 .当k是整数时, ;当 不是整数时,通过从总体中剔除一些个体使剩下的个nNnNk体数 能被 整除,这时 ; 3.确定起始的个体编号.在第 1 段中用简单随机抽样确

5、定起始的个体编号 ;l4.抽取样本.按照先确定的规则(常将 加上间隔 )抽取样本: , ,lkk, .kl2knl1(三)分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.1.分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为 的总体中N抽取一个容量为 的样本时,在整个抽样过程中每个个体被抽到的概率相等,都n等于 ;N2.分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践中应用更为广泛.理解总结(一)常用的抽样方法及它们之间的联

6、系和区别:类型 共同点 各自特点 相互联系 适用范围简单随机抽样 从总体中逐个抽取总体中的个数比较少系统抽样将总体均匀分成几个部分,按照事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个数比较多分层抽样抽样过程中每个个体被抽取的概率是相同的将总体分成几层,分层进行抽取各层抽样时采用简单抽样或者系统抽样总体由差异明显的几部分组成(二)不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.简单随机抽样、系统抽样、分层抽样都是不放回抽样.高考导航例 1 (1)某公司在甲、乙、丙、丁四个

7、地区分别有 150 个、120 个、180 个、150 个销售点.公司为了调查产品销售的情况,需从这 600 个销售点中抽取一个容量为 100 的样本,记这项调查为;在丙地区中有 20 个特大型销售点,要从中抽取 7 个调查其销售收入和售后服务情况,记这项调查为.则完成、这两项调查宜采用的抽样方法依次是( )(A)分层抽样法,分层抽样法.(B)分层抽样法,简单随机抽样法.(C)简单随机抽样法,分层抽样法.(D)简单随机抽样法,简单随机抽样法.(2)2010 年 8 月 7 日晚 22 点左右,甘肃舟曲县强降雨引发泥石流,造成了巨大的人员伤亡和财产损失.某地区选出 600 名消防官兵参与舟曲救援

8、,将其编号为:001,002,600,为打通生命通道,先采用系统抽样方法抽出 50 名为先遣部队,且随机抽得的号码为 003.这 600 名官兵来源于不同的县市,从 001 到 300来自 市,从 301 到 495 来自 市,从 496 到 600 来自 市,则三个市被抽中的人ABC数依次为( )(A)26,16,8. (B)25,17,8. (C)25,16,9. (D)24,17,9.解题思路 (1)当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样;(2)根据系统抽样的特点,可知抽出的 50 个号码,组成了以 3 为首项,12 为公差的等差数列,这样就将问题转

9、化为数列问题.解析:(1)依据题意,第项调查应采用分层抽样法,第项调查应采用简单随机抽样法.故选 B.(2)依题意可知,在随机抽样中,首次抽到 003 号,以后每隔 12 个号抽到一个人,则分别是 003、015、027、039、051、063、075,容易知道抽到的编号构成以 3 为首项,12 为公差的等差数列,故被抽到的第 名消防官兵的编号为n,由 ,则 ,因此抽取到的912nnan 30912An251A市的人数为 25 人.同理可知其他两市的人数为 17 和 8.故选 B.A例 2 (1)用随机数表法从 100 名学生(男生 25 人)中抽选 20 人进行评教,某男生被抽到的可能性是(

10、 )(A) . (B) . (C) . (D) .102515141(2)某学校有教师 200 人,男学生 1200 人,女学生 1000 人.现用分层抽样的方法从全体师生中抽取一个容量为 的样本,若女学生一共抽取了 80 人,则 的值n n为( )(A)193. (B)192. (C)191. (D)190.解析: (1)由于每位学生被抽到的可能性是一样的,均为 .5102(2) ,求得 .8012010n19n二、用样本估计总体(一)用样本的频率分布估计总体分布1.样本的频率分布直方图作频率分布直方图的步骤:因为频率分布直方图中横轴表示“组距”,纵轴表示“频率/组距”,所以“小长方形的面积

11、=组距频率/组距=频率”,各小长方形的面积之和等于 1.2.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.3.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.4.茎叶图(1)茎是指中间的一列数,叶是从茎的旁边生长出来的数.(2)茎叶图表示数据有两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.(3)在样本数据较少时,用茎叶图表示数据的效果较好,但当样本数据较多时,茎叶图就显得不太方便了.(二)用样本的数字特征估计

12、总体的数字特征1.平均数:一组数据的总和除以数据的个数所得的商就是平均数;它是频率分布直方图的“重心”.2.中位数:如果将一组数据按从小到大或从大到小的顺序依次排列,当数据有奇数个时,处在中间的一个数就是这组数据的中位数;当数据有偶数个时,处在中间的两个数的平均数就是这组数据的中位数.因此中位数不一定是样本数据中的数.在频率分布直方图中中位数左右两侧直方图的面积应该相等,由此在图中我们可以估计其近似值.3.众数:在样本数据中出现次数最多的数叫做这组数据的众数.若一组样本数据中有两个或几个数据出现的最多且次数一样,这些数据都是这组数据的众数;若一组数据中每个数据出现的一样多,则认为这组数据没有众

13、数.4.方差:已知一组数据为 则这组数据的方差 ,nxx,321 212niixs其中 ,用它来衡量数据围绕平均数的波动情况.21nix5.标准差:是方差的算术平方根 .它比方差多开一次方,它21niixs的度量单位与样本数据的相同,有时用它更加方便.理解总结样本频率分布直方图是考查热点,需注意频率分布直方图中横轴表示“组距”,纵轴表示“频率/组距”,所以“小长方形的面积=组距(频率/组距)=频率”,各小长方形的面积之和等于 1.对于平均数、众数、中位数、方差等要会求,并能理解其意义.高考导航例 1 (1)右图是根据某校 10 位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右

14、分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这 10 位同学身高的中位数是( ) (A)161 cm. (B)162 cm. (C)163 cm. (D)164 cm.(2)根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度在 20-80 mg/100 ml(不含 80)之间,属于酒后驾车;血液酒精浓度在 80 mg/100ml (含 80)以上时,属醉酒驾车.据法制晚报报道,2010 年 3 月 15 日至 3 月 28 日,全国查处酒后驾车和醉酒驾车共 28800 人,如图是对这 28800 人酒后驾车血液中酒精含量进行检测所得结果的频率

15、分布直方图,则属于醉酒驾车的人数约为 .解题思路 (1)理解茎叶图的结构和中位数的找法是解决本题的关键;(2)对于频率分布直方图,注意纵轴为频率与组距的比值.根据图中的量可求出醉酒驾车的频率,从而可知其人数.解析:(1)由给定的茎叶图可知,这 10 位同学身高的中位数为.cm1623(2)由给定的频率分布直方图可知,驾驶员血液酒精浓度在 80 mg/100 ml(含80)以上的频率为(0.01+0.005)10=0.15.故属于醉酒驾车的人数约为288000.15=4320.例 2第 26 届世界大学生夏季运动会于 2011 年 8 月 12 日到 23 日在深圳举行,运动会期间,为了搞好接待

16、工作,组委会在某学院招募了 12 名男志愿者和 18名女志愿者.将这 30 名志愿者的身高编成如下图所示的茎叶图(单位:cm):若身高在175 cm 以上(包括 175 cm)定义为“高个子”,身高在 175 cm 以下(不包括 175 cm)定义为“非高个子”,且只有“女高个子”才担任“礼仪小姐”.(1)如果用分层抽样的方法从“高个子”和“非高个子”中抽取 5 人,再从这5 人中选 2 人,那么至少有一人是“高个子” 的概率是多少?(2)若从所有“高个子”中选 3 名志愿者,用 表示所选志愿者中能担任“礼X仪小姐”的人数,试写出 的分布列,并求 的数学期望.X解题思路 (1)首先根据分层抽样的规律找到所抽取的 5 人中“高个子”和“非高个子”的人数.对于“至

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 中学学案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号