随机抽样方法

上传人:s9****2 文档编号:567247855 上传时间:2024-07-19 格式:PPT 页数:22 大小:731.50KB
返回 下载 相关 举报
随机抽样方法_第1页
第1页 / 共22页
随机抽样方法_第2页
第2页 / 共22页
随机抽样方法_第3页
第3页 / 共22页
随机抽样方法_第4页
第4页 / 共22页
随机抽样方法_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《随机抽样方法》由会员分享,可在线阅读,更多相关《随机抽样方法(22页珍藏版)》请在金锄头文库上搜索。

1、 随机抽样方法随机抽样方法在在19361936年年美国总统选举美国总统选举前,一份颇有名气的杂志的工作人员做了一前,一份颇有名气的杂志的工作人员做了一次次民意测验民意测验. .调查调查兰顿兰顿(当时任(当时任堪萨斯州堪萨斯州州长)和州长)和罗斯福罗斯福(当时的总(当时的总统)中谁将当选下一届总统统)中谁将当选下一届总统. .为了了解公众意向,为了了解公众意向,调查者调查者通过通过电话簿电话簿和车辆登记簿上的名单给一大批人发了和车辆登记簿上的名单给一大批人发了调查表调查表(注意在(注意在19361936年电话年电话和汽车只有少数富人拥有)和汽车只有少数富人拥有). .通过分析收回的调查表,显示兰

2、顿非常通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜受欢迎,于是此杂志预测兰顿将在选举中获胜 实际选举结果正好相反,最后罗斯福在选举中获胜,那实际选举结果正好相反,最后罗斯福在选举中获胜,那么此杂志预测结果出错的原因是什么呢?么此杂志预测结果出错的原因是什么呢? 预测结果出错的原因是:在民意测验中,即抽取样本预测结果出错的原因是:在民意测验中,即抽取样本时,抽取的样本不具备代表性时,抽取的样本不具备代表性.1936.1936年拥有电话和汽车的美国人只是年拥有电话和汽车的美国人只是一小部分,那时大部分人还很穷一小部分,那时大部分人还很穷. .其调查的结果只是富人的意见

3、,不其调查的结果只是富人的意见,不能代表穷人的意见能代表穷人的意见. .例如,某校高中学生有例如,某校高中学生有900人,医务室想对全校学生的身人,医务室想对全校学生的身高情况作一次调查,为了不影响正常教学,准备抽取高情况作一次调查,为了不影响正常教学,准备抽取50名作为调查对象。名作为调查对象。在这个问题中,调查对象的在这个问题中,调查对象的总体总体是某校全体学生的身高,是某校全体学生的身高,个体个体是每个学生的身高,抽取的这是每个学生的身高,抽取的这50名学生的身高是名学生的身高是样样本本,样本容量为,样本容量为50。统计统计统计所要解决的问题如何根据样本来推断总体,首统计所要解决的问题如

4、何根据样本来推断总体,首先要做的就是采集样本,然后才能作统计推断。先要做的就是采集样本,然后才能作统计推断。如何抽取样本,直接关系到对总体估计的准确程度,因如何抽取样本,直接关系到对总体估计的准确程度,因此在抽样时要保证此在抽样时要保证每个个体被抽到的机会是均等的每个个体被抽到的机会是均等的,满,满足这样条件的抽样叫做随机抽样。足这样条件的抽样叫做随机抽样。简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样常用方法常用方法随机抽样随机抽样 一个布袋中有一个布袋中有6个同样质地的球,从中先后不个同样质地的球,从中先后不放回地抽取三个球。放回地抽取三个球。 第一次抽取时,第一次抽取时

5、,6个球中的每一个球被抽到的个球中的每一个球被抽到的可能性都是可能性都是_ ; 第二次抽取时,余下的第二次抽取时,余下的5个球中的每一个被抽个球中的每一个被抽到的可能性都是到的可能性都是_ ; 第三次抽取时,余下的第三次抽取时,余下的4个球被抽到的可能性个球被抽到的可能性都是都是_ 。引例引例 1也就是说,每次抽取时,每个球都也就是说,每次抽取时,每个球都有相同的可能性被抽到!有相同的可能性被抽到!注意注意(1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;)它是一种不放回抽样

6、;(4)它是一种等概率抽样。它是一种等概率抽样。 一一般般地地,从从元元素素个个数数为为N的的总总体体中中逐逐个个、不不放放回回地地抽抽取取容容量量为为n的的样样本本,如如果果每每次次抽抽取取时时各各个个个个体体被被抽抽到到的的概概率率相相等等,这这样样的的抽抽样样方方法法叫叫做做简简单单随随机机抽抽样样,这这样样抽取的样本,叫做简单随机样本抽取的样本,叫做简单随机样本 。1、概念、概念(一)简单随机抽样(一)简单随机抽样抽签法、随机数表法抽签法、随机数表法2、 简单随机抽样的方法:简单随机抽样的方法:(1)抽签法)抽签法步步骤骤 将总体中的所有个体(共将总体中的所有个体(共N个)编号(号码可

7、个)编号(号码可以从以从1到到N),对个体编号时,也可以利用已有的编号。例如),对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。学生的学号,座位号等。 把号码写在形状、大小相同的号签上(号签把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行一个箱子里,进行均匀搅拌均匀搅拌。 抽签时,每次从中抽出抽签时,每次从中抽出1个号签,连续抽取个号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。的样本。要从我们班要从我们班50名同学中随机抽取名同学中随机抽取3人参加心理

8、人参加心理测试,请设计抽样方法。测试,请设计抽样方法。小试身手小试身手优缺点优缺点优点:简单易行简单易行缺点:仅适用于个体数较少的总体仅适用于个体数较少的总体。当总体个数较多时,搅拌得有可当总体个数较多时,搅拌得有可能不均匀,导致抽样不公平。费能不均匀,导致抽样不公平。费时费力。时费力。(2 2)随机数表法)随机数表法(1)随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证表中的证表中的每个位置上的数字是等可能出现的每个位置上的数字是等可能出现的。 (2)随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以任任选选一一个个数数作作为为开始,读数的

9、方向可以向左,也可以向右、向上、向下等等。开始,读数的方向可以向左,也可以向右、向上、向下等等。 (3)用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;选定开始的数字;获取样本号码。选定开始的数字;获取样本号码。 (4)由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样本保证了被抽取个体的概率是相等的。样本保证了被抽取个体的概率是相等的。 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意或随便抽取都会带有主观或客观的影响因素意或随便抽取都会带有主观或客观的影响因素注意注意 优缺点优缺点优点简单易行

10、,很好地解决了当简单易行,很好地解决了当总体个数较多时抽签法制签总体个数较多时抽签法制签难的问题。难的问题。缺点当总体个数很多,需要的样当总体个数很多,需要的样本容量也很大时,用此法很本容量也很大时,用此法很不方便不方便引例引例 2 为了了解高一年级为了了解高一年级12000名学生的数学成绩名学生的数学成绩,需要抽需要抽取容量为取容量为120的样本的样本,用简单随机抽样还方便吗?请用用简单随机抽样还方便吗?请用合适的方法抽取合适的方法抽取.解解:(1)对全体学生的数学成绩进行编号对全体学生的数学成绩进行编号:1,2,3,12000.(2)分段分段:由于样本容量与总体容量的由于样本容量与总体容量

11、的 比是比是1:100,我们我们将总体平均分为将总体平均分为120个部分个部分,其中每一部分包含其中每一部分包含100个个个体个体.(3)在第一部分即在第一部分即1号到号到100号用号用简单随机抽样简单随机抽样,抽取一个抽取一个号码号码,比如是比如是50.(4)以以50作为起始数作为起始数,然后顺序抽取然后顺序抽取150,250,350,.11950.这样就得到容量为这样就得到容量为120的一个样本的一个样本. 当当总总体体的的个个数数较较多多时时,采采用用简简单单随随机机抽抽样样太太麻麻烦烦,这这时时将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从

12、每每一一部部分分中中抽抽取取1个个个个体体,得得到到所所需需要要的的样样本本,这这种种抽抽样样称为系统抽样,也被称为等距抽样。称为系统抽样,也被称为等距抽样。1、概念、概念 系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段段进进行行抽抽样样时,采用简单随机抽样;时,采用简单随机抽样; 系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是相等的是相等的; 若若总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。随机抽样从总体中剔除几个个

13、体,然后再按系统抽样进行。说明说明(二)系(二)系 统统 抽抽 样样2、步骤、步骤(1)先先将将总总体体中中的的N个个体体编编号号.有有时时可可直直接接利利用用个个体体自自身身所所带的号码带的号码.(2)根据样本容量)根据样本容量n把总体均分为把总体均分为n段,确定段,确定分段间隔分段间隔k。 是是整整数数时时, ; 不不是是整整数数时时,先先从从N中中随随机机剔剔除除一些个体,使得其为整数为止。一些个体,使得其为整数为止。 (3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l 。(4)按照规则抽取样本:)按照规则抽取样本:l, lk, l2k, l(n-1)k3 3、适

14、用情况、适用情况总体容量较大,并且个体之间无明显差异总体容量较大,并且个体之间无明显差异5、系统抽样与简单随机抽样的比较、系统抽样与简单随机抽样的比较 类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随机抽简单随机抽样样从总体中逐个从总体中逐个抽取抽取系统抽样在系统抽样在起始部分抽起始部分抽样时,采用样时,采用简单随机抽简单随机抽样。样。总体个数较总体个数较少少在抽样过程中在抽样过程中每个个体被抽每个个体被抽到的可能性相到的可能性相等等系统抽样系统抽样将总体平均分将总体平均分成几部分,按成几部分,按事先确定的规事先确定的规则分别在各部则分别在各部分抽取分抽取总体个数较总体个数较

15、多且分布均多且分布均衡衡6、方法取舍、方法取舍(1)当总体个数较少,样本容量也较小时当总体个数较少,样本容量也较小时(2)当总体个数较多,样本容量较小时当总体个数较多,样本容量较小时(3)当总体个数较多,样本容量也较大时当总体个数较多,样本容量也较大时抽签法或随机数表法抽签法或随机数表法随机数表法随机数表法系统抽样法系统抽样法分层抽样分层抽样引例引例 3某中学有学生某中学有学生900名,已知高一有名,已知高一有400名学生,高二名学生,高二300名,名,高三高三200名。为了考察他们的体重情况,如何抽取容量为名。为了考察他们的体重情况,如何抽取容量为45的一个样本?的一个样本?分析:分析:“9

16、00名学生的体重名学生的体重”这一总体是由高一、高二、高三这一总体是由高一、高二、高三学生的体重三部分组成,这三部分有明显的差别。我们可以学生的体重三部分组成,这三部分有明显的差别。我们可以把总体分成三把总体分成三“层层”,在各层中按比例进行简单随机抽样或,在各层中按比例进行简单随机抽样或系统抽样!系统抽样!首先,计算样本容量首先,计算样本容量n与总体容量与总体容量N的比为的比为 所所以在高一、高二、高三三个层面上取学生数为以在高一、高二、高三三个层面上取学生数为 , , ,即分别抽取,即分别抽取20,15,10名学生,这一步可通过简单随机抽样达到。名学生,这一步可通过简单随机抽样达到。1、概

17、念、概念 当当总总体体由由明明显显差差别别的的几几部部分分组组成成时时,将将总总体体中中各各个个个个体体按按某某种种特特征征分分成成若若干干个个互互不不重重叠叠的的几几部部分分,每每一一部部分分叫叫做做层层,在在各各层层中中按按层层在在总总体体中中所所占占比比例例进进行行简简单单随随机机抽抽样样或或系统抽样,这种抽样方法叫做分层抽样系统抽样,这种抽样方法叫做分层抽样 分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层

18、之之间间的的差差异异尽尽可可能能地地大大,否否则则将将失失去去分层的意义。分层的意义。2、分层抽样的抽取步骤:、分层抽样的抽取步骤:(1)样本容量与总体确定抽取的比例。)样本容量与总体确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)有有些些层层面面上上除除法法算算出出的的结结果果不不是是整整数数时,求其近似整数值。时,求其近似整数值。例例、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上

19、的的有有95人人。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从从中中抽抽取取100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取? 分分析析:这这总总体体具具有有某某些些特特征征,它它可可以以分分成成几几个个不不同同的的部部分分:不不到到35岁岁;3549岁岁;50岁岁以以上上,把把每每一一部部分分称称为为一一个个层层,因因此此该该总总体体可可以以分分为为3个个层层。由由于于抽抽取取的的样样本本为为100,所所以以必必须须确确定每一层的比例,在每一个层中实行简单随机抽样。定每一层的比例,在每一个层中实行简单随机抽样。 解解:抽抽取取人人数数与与职职工工总总数数的的比比是是100:5001:5,则则各各年年龄龄段段(层层)抽抽取取的的职职工工人人数数依依次次是是25;56;19,然然后后分别在各年龄段(层)运用简单随机抽样方法抽取。分别在各年龄段(层)运用简单随机抽样方法抽取。 答答:在在分分层层抽抽样样时时,不不到到35岁岁、3549岁岁、50岁岁以以上上的三个年龄段分别抽取的三个年龄段分别抽取25人、人、56人和人和19人。人。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号