考点4随机抽样与总体估计

上传人:M****1 文档编号:560603370 上传时间:2024-02-04 格式:DOCX 页数:13 大小:79.44KB
返回 下载 相关 举报
考点4随机抽样与总体估计_第1页
第1页 / 共13页
考点4随机抽样与总体估计_第2页
第2页 / 共13页
考点4随机抽样与总体估计_第3页
第3页 / 共13页
考点4随机抽样与总体估计_第4页
第4页 / 共13页
考点4随机抽样与总体估计_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《考点4随机抽样与总体估计》由会员分享,可在线阅读,更多相关《考点4随机抽样与总体估计(13页珍藏版)》请在金锄头文库上搜索。

1、考点四 随机抽样与总体估计考点要揽理解随机抽样的必要性和重要性。会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方 法。了解分布的意义与作用,会用频率分布表,会画频率分布直方图、频率分 布折线图、茎叶图,体会它们各自的特点。理解样本数据标准差的意义和作用,会计算数据标准差。 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理 的解释。会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的 基本数字特征,理解用样本估计总体的思想。会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问 题。命题趋向 随机抽样这一部分主要考查学生在应用问题中构造抽样模型、

2、识别模型、 选择适当的抽样方法抽取样本。主要是以选择题和填空题为主,属于中低档题,重点考查分层抽样和系统 抽样的计算。以选择题和填空题的形式考查平均数、方差的计算以及茎叶图与频率分布 直方图的简单应用。在解答题中经常把频率分布问题与概率相结合命题,属于中低档题。 备考策略系统掌握有关概念 理解常见的抽样方法及它们之间的联系与区别一、随机抽样(一)简单随机抽样:设一个总体的个数为N .如果通过逐个抽取的方法从中抽 取一个样本,且每次抽取时各个个体被抽到的概率相等 ,就称这样的抽样为简单 随机抽样. 实现简单随机抽样,常用抽签法和随机数表法.1抽签法:先将总体中的所有个体(共有N个)编号(号码可从

3、1到N ),并把号 码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这 些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取 n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.2随机数表法:第一步,将总体中的个体编号(要保证位数一致);第二步,选定 开始的数字;第三步,获取样本号码使用随机数表法时注意:当随机地选定开始 读的数后,读数的方向可以向右,也可以向左、向上、向下等等在读数过程中, 得到一串数字号码,在去掉其中不合要求和与前面重复的号码后 ,其中依次出现 的号码可以看成是依次

4、从总体中抽取的各个个体的号码.用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次1抽取一个个体时任一个个体被抽到的概率为,在整个抽样过程中各个个体被N抽到的概率为-.N(二)系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后 按照预先制定的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫 做系统抽样.系统抽样的步骤可概括为:1. 将总体中的个体编号;2. 将整个的编号进行分段.为将整个的编号进行分段,要确定分段的间隔k .当N是整数时,k = N ;当N不是整数时,通过从总体中剔除一些个体使剩下的个 nn n体数N能被n整除,这时k二-;n3. 确定起

5、始的个体编号在第1段中用简单随机抽样确定起始的个体编号l ;4. 抽取样本按照先确定的规则(常将l加上间隔k )抽取样本:l,l + k,l + 2k,l + (n -I)k .(三)分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分, 然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部 分叫做层.1. 分层抽样是等概率抽样,它也是公平的用分层抽样从个体数为N的总体中 抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都2. 分层抽样是建立在简单随机抽样或系统抽样的基础上的 ,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践

6、中应用更为广泛. 理解总结(一)常用的抽样方法及它们之间的联系和区别:类型共同点各自特点相互联系适用范围简单随 机抽样抽样过 程中每个个 体被抽取的 概率是相同 的从总体中逐个抽取总体中的个数 比较少系统抽样将总体均匀分成几 个部分,按照事先确定 的规则在各部分 抽取在起始部分抽 样时采用简单随 机抽样总体中的个数 比较多分层 抽样将总体分成几层,分 层进行抽取各层抽样时米 用简单抽样或者 系统抽样总体由差异明 显的几部分组成(二)不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总 体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的 抽样为放回抽样.简单随机

7、抽样、系统抽样、分层抽样都是不放回抽样.高考导航例 1 (1) 某公司在甲、乙、丙、丁四个地区分别有 150 个、 120 个、 180 个、 150 个销售点.公司为了调查产品销售的情况,需从这 600 个销售点中抽取一个容 量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取 7个调查其销售收入和售后服务情况,记这项调查为.则完成、这两项调查 宜采用的抽样方法依次是()(A) 分层抽样法,分层抽样法.(B) 分层抽样法, 简单随机抽样法.(C) 简单随机抽样法, 分层抽样法.(D) 简单随机抽样法, 简单随机抽样法.(2)2010年8月7日晚22点左右,甘肃舟曲县强降

8、雨引发泥石流,造成了巨大 的人员伤亡和财产损失.某地区选出 600 名消防官兵参与舟曲救援 ,将其编号 为:001,002, ,600, 为打通生命通道, 先采用系统抽样方法抽出 50 名为先遣部 队,且随机抽得的号码为003.这600名官兵来源于不同的县市,从001到300 来自A市,从301到495来自B市,从496到600来自C 市,则三个市被抽中的人 数依次为()(A)26,16,8.(B)25,17,8.(C)25,16,9.(D)24,17,9.解题思路(1) 当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采 用随机抽样;(2)根据系统抽样的特点,可知抽出的 50

9、 个号码,组成了以 3 为首 项,12为公差的等差数列,这样就将问题转化为数列问题.解析:(1)依据题意,第项调查应采用分层抽样法,第项调查应采用简单随 机抽样法. 故选 B.(2) 依题意可知,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人, 则分别是003、 015、 027、 039、 051、 063、 075,容易知道抽到的编号构成以 3为首项,12为公差的等差数列,故被抽到的第n名消防官兵的编号为a 二 3 + 6 - 1)x 12 二 12n -9,由 1 12n -9 300 ,贝U1 n 25,因此抽取到的 AnAA市的人数为25人同理可知其他两市的人数为17和8

10、.故选B.例2(1)用随机数表法从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的可能性是()1111(A)丄.(B) - .(C) -.(D)-.1002554(2)某学校有教师200人,男学生1200人,女学生1000人.现用分层抽样的方 法从全体师生中抽取一个容量为n的样本,若女学生一共抽取了 80人,则n的值 为()(A)193.(B)192.(C)191.(D)190.20 1解析:(1)由于每位学生被抽到的可能性是一样的,均为 竺二1.1005n(2) 1000 x= 80,求得 n = 192 .200+1200+1000二、用样本估计总体(一)用样本的频率分布估计

11、总体分布1. 样本的频率分布直方图作频率分布直方图的步骤:琳竝卫fBP 组瓯也中业业对最血備的蛰决定粗乐与虽殖1 二a縛散据井塩列福率分棚表页球単势薛克才图因为频率分布直方图中横轴表示“组距”,纵轴表示“频率/组距”,所以“小长方形的面积二组距X频率/组距二频率”,各小长方形的面积之和等于1.2. 频率分布折线图:连接频率分布直方图中各小长方形上端的中点 ,就得频率 分布折线图.3. 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相 应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.4. 茎叶图(1) 茎是指中间的一列数,叶是从茎的旁边生长出来的数.(2) 茎叶图表

12、示数据有两个突出的优点: 其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.(3) 在样本数据较少时,用茎叶图表示数据的效果较好,但当样本数据较多时, 茎叶图就显得不太方便了.(二)用样本的数字特征估计总体的数字特征1. 平均数:一组数据的总和除以数据的个数所得的商就是平均数;它是频率分 布直方图的“重心”.2. 中位数:如果将一组数据按从小到大或从大到小的顺序依次排列 ,当数据有 奇数个时,处在中间的一个数就是这组数据的中位数;当数据有偶数个时,处在中间的两个数的平均数就是这组数据的中 位数. 因此中位数不一定是样本数据中的数.在频率

13、分布直方图中中位数左右两 侧直方图的面积应该相等,由此在图中我们可以估计其近似值.3. 众数:在样本数据中出现次数最多的数叫做这组数据的众数.若一组样本数 据中有两个或几个数据出现的最多且次数一样 ,这些数据都是这组数据的众数; 若一组数据中每个数据出现的一样多,则认为这组数据没有众数.4. 方差:已知一组数据为 x ,x ,x , ,x 则这组数据的方差 s2 二-X(x x)1 2 3 n n ii=1其中x x ,用它来衡量数据围绕平均数的波动情况.nii=15. 标准差:是方差的算术平方根s丄Y (x -无.它比方差多开一次方,它 n ii=1的度量单位与样本数据的相同, 有时用它更加

14、方便.理解总结样本频率分布直方图是考查热点 , 需注意频率分布直方图中横轴表示“组 距”,纵轴表示“频率/组距”,所以“小长方形的面积二组距x(频率/组距)=频 率”,各小长方形的面积之和等于 1.对于平均数、众数、中位数、方差等要会求, 并能理解其意义.高考导航例1(1)右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表 示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是 ()15 5 5 7 816 13 3 517 1 2(A) 161 cm.(B)162 cm.(C)163 cm.(D)16

15、4 cm.(2)根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度 在20-80 mg/100 ml (不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100ml (含80)以上时,属醉酒驾车.据法制晚报报道, 20 10年3月15 日至3月28 日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人酒后驾车血液 中酒精含量进行检测所得结果的频率分布直方图 , 则属于醉酒驾车的人数约 为(1)理解茎叶图的结构和中位数的找法是解决本题的关键 ;(2)对于频率分 布直方图,注意纵轴为频率与组距的比值.根据图中的量可求出醉酒驾车的频率, 从而可知其人数.解析:(1)由给定的茎叶图可知,这10位同学身高的中位数为161 +163=162cm 2(2)由给定的频率分布直方图可知,驾驶员血液酒精浓度在80 mg/100 ml(含 80)以上的频率为(0.01+0.005)X10=0.15.故属于醉酒驾车的人数约为 28800X0. 15=4320.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号