《第三讲 样本的抽取》由会员分享,可在线阅读,更多相关《第三讲 样本的抽取(36页珍藏版)》请在金锄头文库上搜索。
1、第三讲第三讲 样本的抽取样本的抽取学习目标:n理解抽样的基本原理;n掌握几种常见抽样方法,并能熟练应用于教育研究当中。一、抽样的基本原理一、抽样的基本原理 抽样就是从一个总体中抽取部分具有代表性的个体抽样就是从一个总体中抽取部分具有代表性的个体抽样就是从一个总体中抽取部分具有代表性的个体抽样就是从一个总体中抽取部分具有代表性的个体作为样本,然后用这一样本的结果去推断总体。作为样本,然后用这一样本的结果去推断总体。作为样本,然后用这一样本的结果去推断总体。作为样本,然后用这一样本的结果去推断总体。(总体、样本、样本容量)(总体、样本、样本容量)(总体、样本、样本容量)(总体、样本、样本容量) 总
2、体100000人样本1000人随机抽样随机抽样 研究结果研究结果 推断推断 抽样基本原理关系图二、抽样的基本要求1明确规定总体2取样的随机性3取样的代表性 4合理的样本容量三、概率抽样的方法n n遵循随机化原则的抽样称为概率抽样。n n理论依据: 大数法则大数法则 1简单随机抽样 n n定义:总体中每个个体被抽到的机会是均等的,且在抽样取走一个个体之后总体内成分不变。n n如图:如图:简单随机抽样一般用下述三种方法: (1)抽签法)抽签法 (2)查表法)查表法 (3)计算机造数法)计算机造数法 n n主要适用于小总体的情况。 2系统抽样(等距抽样) n n这种抽样的具体做法是这种抽样的具体做法
3、是这种抽样的具体做法是这种抽样的具体做法是:(1 1)将总体的所有单位按一定顺序排列起来。)将总体的所有单位按一定顺序排列起来。(2 2)计算抽样间隔。抽样间隔是有总体所含的单位数与样本)计算抽样间隔。抽样间隔是有总体所含的单位数与样本容量决定的。假设前者是容量决定的。假设前者是N N个,后者为个,后者为n n个,则抽样间隔应个,则抽样间隔应是是K KN/nN/n。(3 3)在第一个抽样间隔内用完全随机的方法抽取一个单位作)在第一个抽样间隔内用完全随机的方法抽取一个单位作为第一个样本单位。为第一个样本单位。(4 4)以第一个抽中的单位为起点,每隔)以第一个抽中的单位为起点,每隔k k个总体单位
4、抽取一个个总体单位抽取一个单位作为样本单位,直至抽满为止。单位作为样本单位,直至抽满为止。 例1 现有180名学生,要利用系统抽样法从中抽取15名学生作研究样本,其方法如下: 先将学生按与学生学习成绩无关的标志编号,假先将学生按与学生学习成绩无关的标志编号,假设按学生座位顺序把学生编为设按学生座位顺序把学生编为1 1180180号,然后按下号,然后按下述步骤抽取:述步骤抽取: (1 1)确定间隔距离)确定间隔距离 ;(2 2)决定起点)决定起点R=R=(K+2K+2)/2=/2=(12+212+2)/2=7/2=7,即决定从第一部分的第即决定从第一部分的第7 7号单位作为第一个样本。第号单位作
5、为第一个样本。第二个样本为二个样本为7+12=197+12=19号单位;如此类推,抽出的号单位;如此类推,抽出的1515个个样本为:样本为:(7 7),(),(1919),(),(3131),(),(4343),(),(5555),(),(6767),),(7979),(),(9191),(),(103103),(),(115115),(),(127127),),(139139),(),(151151),(),(163163),(),(175175)。)。例2、下列抽样中不是系统抽样的是( )A A、从标有、从标有115115号的号的1515号的号的1515个小球中任选个小球中任选3 3个作为
6、样本,按从小个作为样本,按从小号到大号排序,随机确定起点号到大号排序,随机确定起点i,i,以后为以后为i+5, i+10(i+5, i+10(超过超过1515则从则从1 1再数起再数起) )号入样。号入样。B B、工厂生产的产品,用传关带将产品送入包装车间前,检验人员、工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验。从传送带上每隔五分钟抽一件产品检验。C C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止。到调查到事先规定的调查人数为止。D D、电影院调查观众
7、的某一指标,通知每排(每排人数相等)座位、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为号为1414的观众留下来座谈。的观众留下来座谈。n n例例3 3、从编号为从编号为1 15050的的5050枚最新研制的某种型号枚最新研制的某种型号的导弹中随机抽取的导弹中随机抽取5 5枚来进行发射实验,若采用每枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所部分选取的号码间隔一样的系统抽样方法,则所选取选取5 5枚导弹的编号可能是(枚导弹的编号可能是( )n nA、5,10,15,20,25 n nB、3,13,23,33,43n nC、1,2,3,4,5 n nD、2,4
8、,6,16,32n例例4.4.从某厂生产的从某厂生产的802802辆轿车中随机抽取辆轿车中随机抽取8080辆辆测试某项性能。请合理选择抽样方法进行抽测试某项性能。请合理选择抽样方法进行抽样,并写出抽样过程。样,并写出抽样过程。n例例5.5.某装订厂平均每小时约装订图书某装订厂平均每小时约装订图书362362册,册,需要检验员每小时抽取需要检验员每小时抽取4040册图书,检验其质册图书,检验其质量状况,请你设计一个抽样方案。量状况,请你设计一个抽样方案。3分层抽样(类型抽样) 分层抽样是先把总体按一定标志分成不同类分层抽样是先把总体按一定标志分成不同类型或层次,然后从各种不同类型中随机抽取若型或
9、层次,然后从各种不同类型中随机抽取若干单位组成样本。干单位组成样本。分层抽样分层抽样分层抽样分层抽样分层抽样分层抽样 假设某地区有高中生假设某地区有高中生2400人,初中生人,初中生10900人,小学人,小学生生11000人。此地区教育部门为了了解本地区中小学生的人。此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查。你认为应当怎样抽取样本?能在的学生进行调查。你认为应当怎样抽取样本?能在14300人中任意取人中任意取143个吗?能将个吗?能将143个份额均分到这三部个份额均分到这三部分中吗?
10、分中吗? 分析:考察对象的特点是由具有明显差异的几部分组成。分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。1 1、一个单位的职工、一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容单位职工与身体状况有关的
11、某项指标,要从中抽取一个容量为量为100100的样本。由于职工年龄与这项指标有关,试问:应的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?用什么方法抽取?解解: :1 1)确定样本容量与总体的个体数之比)确定样本容量与总体的个体数之比100100:500 = 1500 = 1:5 52 2)利用抽样比确定各年龄段应抽取的个体数,依次为)利用抽样比确定各年龄段应抽取的个体数,依次为:125/5,280/5,95/5:125/5,280/5,95/5,即,即2525,5656,1919。3 3)利用简单随机抽样或系统抽样的方法,从各年龄段)利用简单随机抽样或系统抽样的方法,从各年龄段分
12、别抽取分别抽取2525,5656,1919人,然后合在一起,就是所抽取的人,然后合在一起,就是所抽取的样本。样本。1 1、根据总体的差异将总体分为互不交叉的层。、根据总体的差异将总体分为互不交叉的层。2 2、按比例、按比例 k=n/Nk=n/N的比例在每层当中抽取样本。的比例在每层当中抽取样本。3 3、合成样本。、合成样本。 例例22某政府机关有在编人员某政府机关有在编人员100100人,其中副处级以上人,其中副处级以上干部干部1010人,一般干部人,一般干部7070人,工人人,工人2020人。上级机关为了人。上级机关为了了解政府机构改革的意见,要从中抽取一个容量为了解政府机构改革的意见,要从
13、中抽取一个容量为2020的样本,试确定用何种方法抽取,请具体实施操作。的样本,试确定用何种方法抽取,请具体实施操作。1 1抽样比例抽样比例k=1:5;2 2每层中抽取的样本分别为:每层中抽取的样本分别为:n1=10*1/5=2(n1=10*1/5=2(人人) ) n2=70*1/5=14(n2=70*1/5=14(人人) ) N3=20*1/5=4(N3=20*1/5=4(人人) ) 3.3.则样本容量则样本容量: n=n1+n2+n3=20: n=n1+n2+n3=20。n n分层抽样的主要优点分层抽样的主要优点: :一是当一个总体其内部分层明显时,分层抽样能够提高样一是当一个总体其内部分层
14、明显时,分层抽样能够提高样本的代表性,从而提高从样本推断总体的精确性。本的代表性,从而提高从样本推断总体的精确性。 二是分层抽样特别适用于既要对总体参数进行推断,也要二是分层抽样特别适用于既要对总体参数进行推断,也要对各子总体(层)的参数进行推断的情形。对各子总体(层)的参数进行推断的情形。 三是允许不同层的情况采用不同的抽样方法。三是允许不同层的情况采用不同的抽样方法。n n局限性:局限性:调查者必须对总体情况有较多的了解,否则无法调查者必须对总体情况有较多的了解,否则无法进行恰当的分层。进行恰当的分层。4整群抽样整群抽样n n又称聚类抽样,它是将总体按照某种标准划分为又称聚类抽样,它是将总
15、体按照某种标准划分为一些子群体,每个子群体作为一个抽样单位,用一些子群体,每个子群体作为一个抽样单位,用随机的方法从中抽取若干子群,将抽出的子群中随机的方法从中抽取若干子群,将抽出的子群中的所有单位合起来作为总体的样本。的所有单位合起来作为总体的样本。 n思考:思考:n分层抽样与整群抽样的联系与区别?n n整群抽样的主要优点:易于取得抽样框,便于组织,可以节省人力、物力易于取得抽样框,便于组织,可以节省人力、物力和财力和财力 。n n最大缺点:样本分布不均匀,样本的代表性差。样本分布不均匀,样本的代表性差。 四、非概率抽样n n不按照随机化原则进行的抽样叫非概率抽不按照随机化原则进行的抽样叫非
16、概率抽样。样。n n四种类型:四种类型:就近抽样、目标式或判断式抽样、滚雪球就近抽样、目标式或判断式抽样、滚雪球抽样、配额抽样抽样、配额抽样 。就近抽样(偶遇抽样、方便抽样、自然抽样)(偶遇抽样、方便抽样、自然抽样) n n定义定义:是指研究者根据现实情况,以自己方便的是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。择那些离得最近的、最容易找到的人作为调查对象。n n例例n n优点方便省力;方便省力;n n缺点样本的代表性差,有很大的偶然性。样本的代表性差,有很大的偶然性。
17、目标式和判断式抽样(主观抽样、立意抽样):(主观抽样、立意抽样):n n定义定义:调查者根据研究的目标和自己主观的分析,调查者根据研究的目标和自己主观的分析,来选择和确定调查对象的方法。来选择和确定调查对象的方法。n n它是“有目的的”选择样本 n n优点优点:可以充分发挥研究人员的主观能动作用。可以充分发挥研究人员的主观能动作用。n n缺点:缺点:样本的代表性难以判断,不能推论。样本的代表性难以判断,不能推论。 滚雪球抽样:n n定义定义:当我们无法了解总体情况时,可以从总体中的少当我们无法了解总体情况时,可以从总体中的少数成员入手,对他们进行调查,向他们询问还知数成员入手,对他们进行调查,
18、向他们询问还知道哪些符合条件的人;再去找那些人并询问他们道哪些符合条件的人;再去找那些人并询问他们知道的人。知道的人。 配额抽样(定额抽样):n n定义:按调查对象的某种属性或特征将总体中所有个体分按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样。(类)所占比例与他们在总体中所占比例一样。例:例:假设某高校有假设某高校有20002000名学生,其中男生占名学生,其中男生占6060,女生占,女生占4040;文科学生和理科学生各占;文科学生和理科学生各占5050;一年级学生占;一
19、年级学生占4040,二,二年级、三年级、四年级学生分别占年级、三年级、四年级学生分别占3030、2020和和1010。现要。现要用定额抽样方法依上述三个变量抽取一个规模为用定额抽样方法依上述三个变量抽取一个规模为100100人的样人的样本。本。 n n配额抽样方法的配额抽样方法的缺陷缺陷缺陷缺陷:配额的框架必须十分精确。为了做到这一点,必须掌握最配额的框架必须十分精确。为了做到这一点,必须掌握最新的资料,但这是十分困难的。新的资料,但这是十分困难的。从某些特定的格子中选择样本时,可能会存在偏误。从某些特定的格子中选择样本时,可能会存在偏误。配额抽样和分层抽样的配额抽样和分层抽样的配额抽样和分层
20、抽样的配额抽样和分层抽样的区别区别区别区别:本质上的差别本质上的差别 非概率抽样的优缺点及适用范围: n n其样本的代表性往往较小,误差有时相当大,而其样本的代表性往往较小,误差有时相当大,而且这种误差又无法估计。且这种误差又无法估计。 n n优点:操作方便、省钱省力,统计上也远较概率抽样简操作方便、省钱省力,统计上也远较概率抽样简单;单;n n适于探索性探索性研究。举例:举例:“大学生学习现状调查与学习指导的研究大学生学习现状调查与学习指导的研究” ” “弱智儿童智能特点的研究弱智儿童智能特点的研究” ” “小学学习困难学生教育的研究小学学习困难学生教育的研究”样本大小取决于以下诸方面因素:
21、(1 1)研究的不同类型;)研究的不同类型;(2 2)预定分析的精确程度;)预定分析的精确程度;(3 3)允许误差的大小;)允许误差的大小;(4 4)总体的同质性;)总体的同质性;(5 5)研究者的时间、人力和物力;)研究者的时间、人力和物力;(6 6)取样的方法等。)取样的方法等。 表1从给定的总体确定样本大小一览表总总体体样样本本总总体体样样本本总总体体样样本本10101010220220140140120012002912911515141423023014414413001300297297202019192402401481481400140030230225252424250250
22、152152150015003063063030282826026015515516001600310310353532322702701591591700170031331340403636280280162162180018003173174545404029029016516519001900320320505044443003001691692000200032232255554848320320175175220022003273276060525234034018118124002400331331656556563603601861862600260033533570705959
23、380380191191280028003383387575636340040019619630003000341341808066664204202012013500350034634685857070440440205205400040003513519090737346046021021045004500354354959576764804802142145000500035735710010080805005002172176000600036136111011086865505502262267000700036436412012092926006002342348000800036
24、736713013097976506502422429000900036836814014010310370070024824810000100003703701501501081087507502542541500015000375375160160113113800800260260200002000037737717017011811885085026526530000300003793791801801231239009002692694000040000380380190190127127950950274274500005000038138120020013213210001000278278750007500038238221021013613611001100285285100000100000384384研究问题: 幼儿的学习效果与教师的文化程度和教学经验的相互关系 研究假设:n n幼儿的学习效果与教师的文化程度呈正相关。幼儿的学习效果与教师的文化程度呈正相关。n n幼儿的学习效果与教师的教学经验呈正相关。幼儿的学习效果与教师的教学经验呈正相关。n n求不规则图形面积