抽样方法、总体分布的估计

上传人:206****923 文档编号:42379882 上传时间:2018-06-01 格式:DOC 页数:8 大小:345KB
返回 下载 相关 举报
抽样方法、总体分布的估计_第1页
第1页 / 共8页
抽样方法、总体分布的估计_第2页
第2页 / 共8页
抽样方法、总体分布的估计_第3页
第3页 / 共8页
抽样方法、总体分布的估计_第4页
第4页 / 共8页
抽样方法、总体分布的估计_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《抽样方法、总体分布的估计》由会员分享,可在线阅读,更多相关《抽样方法、总体分布的估计(8页珍藏版)》请在金锄头文库上搜索。

1、12.312.3 抽样方法、总体分布的估计抽样方法、总体分布的估计一、知识梳理一、知识梳理 (一)抽样1.简单随机抽样:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样奎屯王新敞新疆 用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过nN1程中各个个体被抽到的概率为; 简单随机抽样的特点是,逐个抽取,且Nn各个个体被抽到的概率相等; 简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础 (4).简单随机抽样的特点:它是不放回抽样;它

2、是逐个地进行抽取;它是一种等概率抽样奎屯王新敞新疆简单抽样常用方法:(1)抽签法:先将总体中的所有个体(共有 N 个)编号(号码可从 1 到 N) ,并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制 作) , 然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一 个号签,连续抽取 n 次,就得到一个容量为 n 的样本 奎屯王新敞新疆 适用范围:总体的个体数不多时 奎屯王新敞新疆 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法(2)随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编 号;第二步,选定开始的数字;第三步,获取样本号码 奎屯王新敞新

3、疆2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然 后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样 叫做系统抽样系统抽样的步骤:采用随机的方式将总体中的个体编号奎屯王新敞新疆为简 便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户 的门牌号,等等奎屯王新敞新疆 为将整个的编号分段(即分成几个部分) ,要确定分段的间隔 k奎屯王新敞新疆当(N 为总体中的个体的个数,n 为样本容量)是整数时,k=;当N nN n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能N nN被 n 整除,这时 k=.在第一段用简单随机抽样确定起始的

4、个体编号奎屯王新敞新疆 按N nl照事先确定的规则抽取样本(通常是将 加上间隔 k,得到第 2 个编号 +k,第 3ll 个编号 +2k,这样继续下去,直到获取整个样本) 奎屯王新敞新疆l 系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系 在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的 总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽 样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从 总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样奎屯王新敞新疆 奎屯王新

5、敞新疆3.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地 反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样, 这种抽样叫做分层抽样,所分成的部分叫做层奎屯王新敞新疆常用的抽样方法及它们之间的联系和区别:类别共同点各自特点相互联系适用范围简单随机 抽样从总体中逐个抽取总体中的个数比较 少系统抽样将总体均匀分成几 个部分,按照事先 确定的规则在各部 分抽取在起始部分抽样 时采用简单随机 抽样总体中的个数比较 多分层抽样抽样过程中 每个个体被 抽取的概率 是相同的 将总体分成几层, 分层进行抽取各层抽样时采用 简单抽样或者相 同抽样总体由差异明显的 几部分组成

6、不放回抽样和放回抽样 :在抽样中,如果每次抽出个体后不再将它放回 总体,称这样的抽样为 不放回抽样 ;如果每次抽出个体后再将它放回总体, 称这样的抽样为 放回抽样 随机抽样、系统抽样、分层抽样都是不放回抽样奎屯王新敞新疆奎屯王新敞新疆(二)总体分布 1.总体:在数理统计中,通常把被研究的对象的全体叫做总体. 2.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据 (或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的 分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直 方图来表示. 3.总体分布:从总体中抽取一个个体,

7、就是一次随机试验,从总体中抽取一个容量为 n 的样本,就是进行了 n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概 率分布规律称为总体分布. 4.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总 体在相应各组取值的概率设想样本容量无限增大,分组的组距无限缩小,那 么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线位 位 位 位 位 位b位 位O位 位 /位 位a0.5人数(人)时间(小时)2010501.0 1.5 2.015它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区 间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b

8、及x轴所围图形的面 积二、基础训练二、基础训练 1.一个总体中共有 10 个个体,用简单随机抽样的方法从中抽取一容量为 3 的样本,则 某特定个体入样的概率是 CA.B.C.D. 3 10C3 89103 103 1012.(2004 年江苏,6)某校为了了解学生的课外阅读情况,随机调查了 50 名学生,得 到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得 这 50 名学生这一天平均每人的课外阅读时间为 BA.0.6 hB.0.9 hC.1.0 hD.1.5 h 3.一个年级有 12 个班,每个班有 50 名同学,随机编号为 150 号,为了了解他们在 课外的兴

9、趣爱好,要求每班的 33 号学生留下来参加阅卷调查,这里运用的抽样方法是 D A.分层抽样法 B.抽签法 C.随机数表法 D.系统抽样法 4.为调查参加运动会的 1000 名运动员的年龄情况,从中抽查了 100 名运动员的年龄, 就这个问题来说,下列说法正确的是 A.1000 名运动员是总体B.每个运动员是个体 C.抽取的 100 名运动员是样本D.样本容量是 100 解析:这个问题我们研究的是运动员的年龄情况.因此应选 D. 答案:D 5.一个容量为 n 的样本,分成若干组,已知某数的频数和频率分别为 40、0.125,则 n 的值为 A.640 B.320 C.240 D.160解析:=0

10、.125,n=320.故选 B.n40答案:B 6.某单位有老年人 27 人,中年人 54 人,青年人 81 人,为了调查他们的健康状况,需 从他们中抽取一个容量为 36 的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中 较合适的抽样方法是_. 解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样5.某班学生在一次数学考试中成绩分布如下表:分数段0,80)80,90)90,100)人数256分数段100,110)110,120 120,130)人数8126分数段130,140)140,150)人数42那么分数在100,110)中的频率和分数不满 110 分的累积频率分

11、别是 _、_(精确到 0.01). 解析:由频率计算方法知:总人数=45.分数在100,110)中的频率为 =0.1780.18.458分数不满 110 分的累积频率为=0.47.458652 4521答案:0.18 0.47 三、例题剖析三、例题剖析 【例 1】 (2004 年湖南,5)某公司在甲、乙、丙、丁四个地区分别有 150 个、120 个、180 个、150 个销售点.公司为了调查产品销售的情况,需从这 600 个销售点中抽取一 个容量为 100 的样本,记这项调查为;在丙地区中有 20 个特大型销售点,要从中抽取 7 个调查其销售收入和售后服务情况,记这项调查为.则完成、这两项调查

12、宜采用的抽 样方法依次是 A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法 剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的 个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样. 依据题意,第项调查应采用分层抽样法、第项调查应采用简单随机抽样法.故选 B. 答案:B 评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定. 【例 2】 (2004 年福建,15)一个总体中有 100 个个体,随机编号为 0,1,2,99,依编号顺序平均分成 10 个小组,组号依次为 1,2,3,10

13、.现用系 统抽样方法抽取一个容量为 10 的样本,规定如果在第 1 组随机抽取的号码为 m,那么在第 k 小组中抽取的号码个位数字与 m+k 的个位数字相同.若 m=6,则在第 7 组中抽取的号码是 _. 剖析:此问题总体中个体的个数较多,因此采用系统抽样 .按题目中要求的规则抽取 即可.m=6,k=7,m+k=13,在第 7 小组中抽取的号码是 63. 答案:63 评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组 内抽取时应按规则进行. 【例 3】 把容量为 100 的某个样本数据分为 10 组,并填写频率分布表,若前七组的 累积频率为 0.79,而剩下三组的频数

14、成公比大于 2 的整数等比数列,则剩下三组中频数最 高的一组的频数为_.)剖析:已知前七组的累积频率为 0.79,而要研究后三组的问题,因此应先求出后三组 的频率之和为 10.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后, 再计算后三组的共有频数. 由已知知前七组的累积频数为 0.79100=79,故后三组共有的频数为 21,依题意=21,a1(1+q+q2)=21.a1=1,q=4.后三组频数最高的一组的频数为 16.qqa 1)1 (3 1答案:16 评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗? 【例 4】 对某电子元件进行寿命追踪调查,情况如下:

15、寿命(h)100200200300300400400500500600个 数2030804030(1)列出频率分布表; (2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在 100400 h 以内的概率; (4)估计电子元件寿命在 400 h 以上的概率. 剖析:通过本题可掌握总体分布估计的各种方法和步骤. 解:(1)频率分布表如下:寿命(h)频 数频 率累积频率100200200.100.10200300300.150.25300400800.400.65400500400.200.85500600300.151合 计2001(2)频率分布直方图如下:100 200 300

16、400 500 600 寿命(h)频率 组距100 200 300 400 500 600 寿命(h)1.00 0.80 0.60 0.40 0.20累积频率(3)由累积频率分布图可以看出,寿命在 100400 h 内的电子元件出现的频率为 0.65,所以我们估计电子元件寿命在 100400 h 内的概率为 0.65. (4)由频率分布表可知,寿命在 400 h 以上的电子元件出现的频率为 0.20+0.15=0.35,故我们估计电子元件寿命在 400 h 以上的概率为 0.35. 评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.【例 5】 某批零件共 160 个,其中,一级品 48 个,二级品 6

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号