最新四章节抽样调查幻灯片

上传人:cn****1 文档编号:569942670 上传时间:2024-07-31 格式:PPT 页数:64 大小:994KB
返回 下载 相关 举报
最新四章节抽样调查幻灯片_第1页
第1页 / 共64页
最新四章节抽样调查幻灯片_第2页
第2页 / 共64页
最新四章节抽样调查幻灯片_第3页
第3页 / 共64页
最新四章节抽样调查幻灯片_第4页
第4页 / 共64页
最新四章节抽样调查幻灯片_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《最新四章节抽样调查幻灯片》由会员分享,可在线阅读,更多相关《最新四章节抽样调查幻灯片(64页珍藏版)》请在金锄头文库上搜索。

1、四章节抽样调查四章节抽样调查一、抽样与抽样调查v是是一一种种选选择择调调查查对对象象的的程程序序和和方方法法:从从研研究究对对象象的的整整体体中中选选出出一一部部分分代代表表加加以以调调查查研研究究,然然后后用用所所得得结结果果推论和说明总体的特性。推论和说明总体的特性。 v日常生活中的抽样调查日常生活中的抽样调查v同质性总体和异质性总体同质性总体和异质性总体v抽样的代表性问题抽样的代表性问题v概概率率论论和和数数理理统统计计学学中中理理论论证证明明:遵遵循循随随机机原原则则的的概概率率抽抽样样可可以以保保证证抽抽选选出出有有一一定定代代表表性性的的样样本本,并并能能够够通通过过计计算算估估计

2、计样样本本与与总总体体间间误误差差的的大大小小以以及及这这种种估估计计的可信程度。的可信程度。3 3、决定抽样方案决定抽样方案 对于不同研究目的,不同调查范围、对象和客观条件的社会调查,需要选择合适的抽样方法。还要根据调查的要求确定样本规模及主要目标量的精确程度。 4 4、实际抽取样本、实际抽取样本 严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。 5 5、评估样本质量评估样本质量v 对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致的调查失误。v 基本方法:将可得到的总体有关的特征及其分布的资料与样本中的同类指标进行对比,若二者差别很

3、小,则样本质量较高,代表性较大,反之样本质量不高。v 对样本的评估分为两个阶段: A、正式调查前,对抽出的样本进行评估 B、调查结束后,计算抽样误差由样本统计值推论 总体参数值等 五、抽样的类型六、概率抽样1 1、简单随机抽样(纯随机抽样)、简单随机抽样(纯随机抽样) (1 1)是是最最基基本本的的随随机机抽抽样样,也也是是最最常常见见的的类类型型。按按随随机机的的原原则则直直接接从从含含有有N N个个单单位位的的总总体体中中,抽抽出出M M个个单单位位作作为为样样本本进进行行调调查查。严严格格遵遵从从了了使使每每个个单单位位有有同同等等被被抽抽中中的的原则。原则。 (2 2)具体做法)具体做

4、法 A A、 抽抽签签法法将将总总体体中中每每个个单单位位的的名名称称或或号号码码,逐逐个个填填写写在在卡卡片片或或签签条条上上,再再放放入入同同一一容容器器中中,打打乱乱次次序序,进进行行搅搅拌拌,然然后后从从中中抽抽取取,直直到到抽抽够够预预定定的的样样本本数数目。目。 v可分为:重复抽样、不重复抽样。可分为:重复抽样、不重复抽样。v抽抽签签法法的的优优点点是是简简单单易易行行,缺缺点点是是当当总总体体的的容容量量非非常常大大时时,费费时时、费费力力,又又不不方方便便。如如果果标标号号的的签搅拌得不均匀,会导致抽样不公平。签搅拌得不均匀,会导致抽样不公平。 B B、随机数表法、随机数表法v

5、对于总体元素较多的情形,采用随机数表抽样对于总体元素较多的情形,采用随机数表抽样v随随机机数数表表的的特特点点:随随机机数数表表中中的的数数码码和和排排列列都都是是随随机机形形成成的的,没没有有任任何何规规律律性性(也也称称乱乱数数表表)。随机数表如下图所示(截取部分)随机数表如下图所示(截取部分)v步骤:步骤:先取得一份调查总体所有元素的名单(即抽样框);先取得一份调查总体所有元素的名单(即抽样框);将总体中所有元素一一按顺序编号;将总体中所有元素一一按顺序编号;根根据据总总体体规规模模是是几几位位数数来来确确定定从从随随机机数数表表中中选选几几位数码;位数码;以以总总体体的的规规模模为为标

6、标准准,对对随随机机数数表表中中的的数数码码逐逐一一进行衡量并决定取舍;进行衡量并决定取舍;根据样本规模的要求选择出足够的数码个数;根据样本规模的要求选择出足够的数码个数;依依据据从从随随机机数数表表中中选选出出的的数数码码,到到抽抽样样框框中中去去找找出它所对应的元素。出它所对应的元素。v例:某总体共有3000人,需要从中抽取200人作为样本进行调查,试用随机数表法进行抽样。(2 2)简简单单随随机机抽抽样样方方法法适适用用对对象象:总总体体单单位位数数目目不不大大,总总体体单单位位之之间间差差异异程程度度较较小小的的情情况况。简简单单随机抽样一般不单独使用。随机抽样一般不单独使用。(3 3

7、)优点:最符合抽样的随机原则,简便易行。)优点:最符合抽样的随机原则,简便易行。 缺点:适用范围较小。缺点:适用范围较小。 2 2、系统抽样(等距抽样或机械抽样)、系统抽样(等距抽样或机械抽样) v定定义义:先先把把总总体体单单位位进进行行编编号号排排序序,然然后后计计算算出出某某种种间隔,再按这一固定间隔抽取个体的号码组成样本。间隔,再按这一固定间隔抽取个体的号码组成样本。v方法步骤方法步骤 将将总总体体的的所所有有个个体体按按一一定定顺顺序序排排号号,前前后后排排列列,制制定抽样框;定抽样框;计计算算抽抽样样间间距距:K(K(抽抽样样间间距距)=N )=N ( (总总体体规规模模) ) /

8、n /n ( (样样本规模本规模) ) 在在前前面面的的K K个个个个体体中中,用用简简单单随随机机抽抽样样的的方方法法抽抽取取一一个个体,设其序号为个个体,设其序号为A A;自自A A开开始始,每每隔隔K K个个个个体体抽抽取取一一个个个个体体,则则陆陆续续抽抽取取的的个个体体所所在在位位置置序序号号为为A A,A+K,A+2K,A+(n-1)K。若若抽抽到到最最后后,仍仍不不足足所所需需样样本本时时,可再回头累积抽取;可再回头累积抽取;将这将这n个个体和起来,就构成了该总体的一个样本。个个体和起来,就构成了该总体的一个样本。v例例:某某大大学学有有1200012000名名学学生生,采采用用

9、系系统统抽抽样样的的方方法抽取法抽取200200名学生作为样本。名学生作为样本。v优点优点 A A、与与简简单单随随机机抽抽样样相相比比,系系统统抽抽样样易易于于实实施施,工工作作较少较少 B B、样样本本在在总总体体中中分分布布更更平平均均,抽抽样样误误差差小小于于或或至至多多等于简单随机抽样,结果更精确。等于简单随机抽样,结果更精确。v缺点缺点 A A、较较适适用用于于同同质质性性较较高高的的群群体体:若若总总体体内内不不同同类类别别之之间间所所含含个个体体数数目目相相差差过过于于悬悬殊殊时时,采采用用此此种种方方法法样样本本的代表性可能较差。的代表性可能较差。 v缺点缺点 B B、当当总

10、总体体的的排排列列出出现现有有规规律律的的分分布布时时,就就会会使使系系统统的抽样误差很大,降低了样本的代表性的抽样误差很大,降低了样本的代表性 (a a)个体排列具有次序先后,等级高低个体排列具有次序先后,等级高低 (b b)个体排列的分布周期与抽样间隔相对应个体排列的分布周期与抽样间隔相对应 解解决决方方法法:认认真真考考察察总总体体的的排排列列情情况况与与抽抽样样的的距距离离,如如果果原原有有的的排排列列次次序序可可能能导导致致抽抽样样失失败败的的话话,就就应应打打乱乱原有的排列次序或改用其他抽样方法。原有的排列次序或改用其他抽样方法。 3、分层抽样分层抽样v定定义义:先先将将总总体体依

11、依照照一一种种或或几几种种特特征征分分为为几几个个子子总总体体(类类、群群),每每个个子子总总体体称称为为一一层层,然然后后从从每每一一层层中中随随机机抽抽取取一一个个子子样样本本,将将它它们们合合在在一一起起即即为为总总体的体的样样本,称本,称为为分分层样层样本。本。v例例:企企业业有有30003000人人,抽抽取取150150人人进进行行抽抽样样调调查查。可可按按性性别别、年年龄龄或或者者二二者者结结合合,或或者者按按照照工工人人、干干部部、技术人员的分层标准技术人员的分层标准v分层的标准分层的标准研研究究者者一一般般选选择择与与调调查查中中欲欲测测变变量量高高度度相相关关的的变变量量,即

12、即:对对所所要要研研究究的的变变量量有有很很大大影影响响因因素素的的变变量作为分层变量。量作为分层变量。突突出出总总体体的的内内在在结结构构特特征征,从从而而使使得得同同层层次次内内同同质性强,层间异质性强。质性强,层间异质性强。具具有有实实用用性性。例例如如以以那那些些已已有有明明显显层层次次区区分分的的变变量量作作为为分分层层变变量量。 性性别别、年年龄龄、文文化化程程度度、职职业业等等v分层类型分层类型按各层子样本容量分类按各层子样本容量分类按按比比例例分分层层抽抽样样指指按按各各种种类类型型或或层层次次中中的的单单位位数数目目同同总总体体单单位位数数目目间间的的比比例例来来抽抽取取子子

13、样样本本的的方法。方法。例例:某某厂厂有有工工人人600600名名,按按性性别别分分层层男男女女比比例例5 5:1 1,抽取,抽取6060名工人。名工人。不不按按比比例例分分层层抽抽样样(非非等等概概率率抽抽样样)主主要要用用于于了了解解一一些些层层所所代代表表的的子子总总体体的的情情况况,而而不不是是总总体情况。体情况。总总体体中中的的某某种种类类型型或或层层次次的的单单位位数数目目太太少少,若若以以按按比比例例分分层层抽抽样样的的方方法法,则则有有的的层层次次在在样样本本中中个个案案太太少少,不便于了解各个层次的情况。不便于了解各个层次的情况。注意:推断总体时,则需要先对各层的数据资料进行

14、注意:推断总体时,则需要先对各层的数据资料进行加权处理,使数据资料恢复到总体中各层实际的比例加权处理,使数据资料恢复到总体中各层实际的比例结构,否则会导致推断的偏误。结构,否则会导致推断的偏误。v优点优点当当一一个个总总体体内内部部分分层层明明显显时时,分分层层抽抽样样能能够够克克服服简简单单的的缺点。缺点。了解总体的不同层次的情况。了解总体的不同层次的情况。分分层层抽抽样样可以提高可以提高总总体参数估体参数估计值计值的精确度。的精确度。 4、整群抽样v定定义义:将将总总体体按按照照某某种种标标准准划划分分为为若若干干子子群群体体,每每个个子子群群体体为为一一个个抽抽样样单单位位,用用随随机机

15、的的方方法法,抽抽取取若若干干个个子群体,将所有抽取的子群体合起来作为总体的样本。子群体,将所有抽取的子群体合起来作为总体的样本。v与与前前几几种种抽抽样样的的最最大大差差别别就就是是抽抽样样单单位位不不是是单单个个的的个个体体,而是成群的个体。而是成群的个体。 v优点优点 a a、 可以通过转换抽样单位,扩大抽样的应用范围。可以通过转换抽样单位,扩大抽样的应用范围。 b b、 可以节省人力、物力、财力。可以节省人力、物力、财力。v缺点:缺点: a a、样本分布不均匀,样本总体的代表性较差。样本分布不均匀,样本总体的代表性较差。 b b、与与其其它它抽抽样样相相比比,在在样样本本数数相相同同时

16、时,抽抽样样误误差差较较大大。 有有数数据据表表明明容容量量为为800800的的整整群群抽抽样样在在效效率率上上相相当于容量为当于容量为500500的简单随机抽样。的简单随机抽样。 v与分层抽样的异同点与分层抽样的异同点 都是根据某种标准将总体分为若干个子群体。都是根据某种标准将总体分为若干个子群体。子群体的划分原则不同。子群体的划分原则不同。分层抽样分层抽样:层间异质性强,层内同质性强。:层间异质性强,层内同质性强。整群抽样整群抽样:反之。:反之。抽样方式不同。抽样方式不同。分分层层抽抽样样:所所有有子子群群体体均均要要抽抽取取一一个个样样本本,作作为为总体的一部分,即总体样本在各层中均有分

17、布。总体的一部分,即总体样本在各层中均有分布。整整群群抽抽样样:将将所所有有子子群群体体作作为为样样本本总总体体,抽抽取取若若干个子群体。干个子群体。适用范围不同适用范围不同分层抽样分层抽样:适用于界质分明的总体。:适用于界质分明的总体。整群抽样整群抽样:适用于界质不清的总体。:适用于界质不清的总体。 v特别注意特别注意 在在分分析析整整群群抽抽样样资资料料时时,虽虽然然抽抽样样误误差差、统统计计推推断断、假假设设检检验验比比前前几几种种方方法法复复杂杂,但但在在大大规规模模、大大范范围围内内应应用时,实施方便。用时,实施方便。5、多阶段抽样(多级抽样)v定定义义:多多阶阶段段抽抽样样又又称称

18、多多级级抽抽样样或或分分段段抽抽样样,它它是是按按抽抽样样元元素素的的隶隶属属关关系系或或层层次次关关系系把把抽抽样样过过程程分分为为几个阶段进行。几个阶段进行。v在在社社会会研研究究中中,当当总总体体的的规规模模特特别别大大,或或者者总总体体分分布布的的范范围围特特别别广广时时,研研究究者者一一般般采采取取多多段段抽抽样样的的方方法来抽取样本。法来抽取样本。v多多段段抽抽样样的的具具体体做做法法是是:先先从从总总体体中中随随机机抽抽取取若若干干大大群群( (组组) ),然然后后再再从从这这几几个个大大群群( (组组) )内内抽抽取取几几个个小小群群( (组组) ),这这样样一一层层层层抽抽下

19、下来来,直直至至抽抽到到最最基基本本的的抽抽样元素为止。样元素为止。v在在运运用用多多阶阶段段抽抽样样方方法法时时,要要在在类类别别和和个个体体之之间间保持平衡,或者保持合适的比例。保持平衡,或者保持合适的比例。v例例:假假设设某某市市共共有有2.42.4万万名名教教师师,分分布布在在1010个个区区200200所所学学校校中中,现现抽抽取取一一个个由由12001200名名教教师师组组成成的的样本,按照三阶段抽样的方法,抽样方案有:样本,按照三阶段抽样的方法,抽样方案有:v确定每一阶段抽样的单位数目时应考虑的因素:确定每一阶段抽样的单位数目时应考虑的因素:各各个个抽抽样样阶阶段段中中的的子子总

20、总体体同同质质性性程程度度。同同质质性性程程度度越越高高的的子子总总体体,所所抽抽取取的的规规模模就就应应相相对对小小一点;反之,则应大一点。一点;反之,则应大一点。各层子总体的人数。各层子总体的人数。研究者所拥有的人力和经费。研究者所拥有的人力和经费。一一般般来来说说,类类别别相相对对较较多多、每每类类中中个个体体相相对对较较少的做法效果较好。少的做法效果较好。v优点优点 A A、通通过过采采用用由由高高级级抽抽样样单单位位过过渡渡到到低低级级抽抽样样单单位位的的方方法法,解解决决了了低低级级抽抽样样单单位位不不易易获获得得抽抽样样框框的的问问题题,并并可可以以使使样样本本的的分分布布较较为

21、为集集中中,大大大大降降低低了了人人力力、物物力力、财力。适用于范围大、总体对象多的社会调查。财力。适用于范围大、总体对象多的社会调查。 B B、多多阶阶段段抽抽样样可可在在各各阶阶段段抽抽样样时时,根根据据具具体体情情况况,灵灵活活选选用用不不同同的的抽抽样样方方法法,可可以以综综合合各各种种抽抽样样方方法法的的优优点,提高样本质量。点,提高样本质量。 v缺点缺点 A A、由由于于每每阶阶段段抽抽样样都都会会产产生生误误差差,所所以以经经多多阶阶段段抽样得到的样本误差也相应增加。抽样得到的样本误差也相应增加。 B B、解解决决方方法法:相相对对增增加加开开头头阶阶段段的的样样本本数数,而而适

22、适当减少最后阶段的样本数。当减少最后阶段的样本数。 练习:练习:假定某县有假定某县有20个乡镇,每个乡镇平均有个乡镇,每个乡镇平均有10个村个村委会,每个村委会平均有委会,每个村委会平均有10个自然村,每个自然个自然村,每个自然村平均有村平均有50户。全县共有户。全县共有200个村委会,个村委会,2000个个自然村、自然村、10万户。现决定采用多阶段随机抽样方万户。现决定采用多阶段随机抽样方法对该县计划生育状况按户做法对该县计划生育状况按户做5的抽样调查,的抽样调查,共抽取共抽取500户,请设计抽样方法。户,请设计抽样方法。6、PPS抽样(概率与元素规模大小成比例抽样) (1 1)实质上是一种

23、不等概率抽样方法。实质上是一种不等概率抽样方法。 (2 2) 适适用用于于当当每每个个元元素素在在总总体体中中的的大大小小不不同同,或或者者在在总总体体中中的的地地位位不不同同时时,采采用用不不等等概概率率抽抽样样的的方方法法,使使得得比比例例大大或或者者在在总总体体中中的的地地位位重重要要的的的的元元素素入入选选的的概概率率大大,比比例例小小的的或或者者在在总总体体中中的的地地位位小小的的元元素素入入选选样样本本的的概概率率小,用以提高小,用以提高样样本代表性的方法。本代表性的方法。 (3 3)例例:假假设设从从全全市市100100家家不不同同规规模模的的企企业业(总总共共2020万名职工)

24、中,抽取万名职工)中,抽取10001000名职工进行调查。名职工进行调查。 u方案一:采用多阶段抽样的方法:方案一:采用多阶段抽样的方法:先从先从100100家企业随机抽取家企业随机抽取2020家企业;家企业;再再从从2020家家企企业业中中分分别别抽抽取取5050名名职职工工(20*5020*5010001000)构构成样本。成样本。100100家家企企业业的的规规模模不不同同:最最大大的的企企业业多多达达1600016000名名职职工工,小小的的企企业业只只有有200200名名职职工工。这这两两类类企企业业中中职职工工被被抽抽中中的的概率不同:概率不同:P P大企业职工被抽中大企业职工被抽

25、中(20/100)*(50/16000)=0.0625%(20/100)*(50/16000)=0.0625%P P小企业职工被抽中小企业职工被抽中(20/100)*(50/200)(20/100)*(50/200)5%5%u方案二:采用多阶段抽样的方法:方案二:采用多阶段抽样的方法:先将各个元素排列起来;先将各个元素排列起来;然后写出他们的规模,计算他们的规模在总体规模然后写出他们的规模,计算他们的规模在总体规模中所占的比例;中所占的比例;将他们的比例累计起来,并根据比例的累计数依次将他们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围写出每一元素所对应的选择号码范围采

26、用随机抽样的方法或系统抽样的方法选择号码,采用随机抽样的方法或系统抽样的方法选择号码,号码对应的元素入选作为第一阶段的样本;号码对应的元素入选作为第一阶段的样本;再从所选的样本中进行第二阶段抽样再从所选的样本中进行第二阶段抽样村委会村委会编编号号户户数数占占总户总户数数比例(比例(% %)累累计计比例比例(% %)抽抽样样号号码码等距抽等距抽样样选选取的号取的号码码入入样样村委村委会和会和调查户调查户数数合合计计40004000村委会村委会0101200200村委会村委会0202160160村委会村委会030314401440村委会村委会0404200200村委会村委会0505120120村委

27、会村委会0606760760村委会村委会0707320320村委会村委会0808400400村委会村委会0909280280村委会村委会1010120120u 练习:某乡镇有练习:某乡镇有10个居委会,共个居委会,共4000户居民,每个户居民,每个村委会人数如下表所示。要选取村委会人数如下表所示。要选取200户作为样本,试用户作为样本,试用PPS抽样的方法抽选样本。抽样的方法抽选样本。七、非概率抽样1 1、 随意抽样(偶遇抽样、方便抽样)随意抽样(偶遇抽样、方便抽样)研研究究者者在在一一定定时时间间、一一定定环环境境里里所所遇遇到到或或接接触触到到的的任任均均入选作为样本的方法。入选作为样本的

28、方法。街头拦人法街头拦人法在在有有些些调调查查中中,调调查查过过程程对对被被调调查查者者来来说说是是不不愉愉快快的的或或是是比比较较麻麻烦烦的的, 此此时时可可以以把把那那些些自自愿愿被被调调查查的的人人作作为为样本。样本。优点:方便、省力;优点:方便、省力; 缺点:样本代表性差,有很大的偶然性缺点:样本代表性差,有很大的偶然性 2、主主观观抽样抽样(立意抽(立意抽样样、判断抽、判断抽样样) v主观的含义:主观的含义:a a、研研究究者者根根据据主主观观判判断断选选取取可可以以代代表表总总体体的的个个体体作作为为样样本本,即即样样本本的的代代表表性性取取决决于于研研究究者者对对总总体体的的了了

29、解解程程度度和和判判断断能能力力;适适用用于于在在无无法法缺缺点点总总体体边边界界,或或因因调调查查者者的的时间和设备有限而无法进行概率抽样时。时间和设备有限而无法进行概率抽样时。b b、 有有目目的的的的选选择择样样本本。适适用用于于:建建立立分分类类模模型型,在在于于发发现问题,提出假设,不在于对总体作出估计。现问题,提出假设,不在于对总体作出估计。 3、定定额额抽抽样样(配(配额额抽抽样样) (1 1) 是是一一种种类类似似于于分分层层抽抽样样的的比比例例抽抽样样。按按照照调调查查对对象象的的某某种种属属性性或或特特征征将将总总体体中中所所有有个个体体分分为为若若干干类类或或层层,然然后

30、后在在各各层层中中抽抽样样,样样本本中中各各层层(类类)所所占占的的比比例例与与他他们在总体中所占的比例一样。们在总体中所占的比例一样。(2 2) 与与分分层层抽抽样样的的区区别别:分分层层抽抽样样中中各各层层样样本本是是随随机机抽抽取的,而定取的,而定额额抽抽样样中,各中,各层样层样本是非随机抽取的。本是非随机抽取的。 (3 3)定定额额样样本本的的选选择择也也可可以以是是基基于于属属性性或或特特征征(变变量量)的组合。的组合。 (4 4) 定定额额抽抽样样假假设设:只只要要类类型型划划分分的的较较细细,那那么么同同一一个个类类型型中中的的每每一一个个个个体体都都是是同同质质的的,因因而而无

31、无需需采采用用随随机机抽抽样样方方案案;只只要要类类型型划划分分合合理理且且分分配配给给各各类类的的名名额额符符合合总总体中各体中各类类人人员员的分布,那么的分布,那么样样本就可以准确的反映本就可以准确的反映总总体。体。 (5 5)假设在理论上成立,但实际实施过程很难做到。)假设在理论上成立,但实际实施过程很难做到。 (6 6)原原因因:在在分分层层时时不不能能兼兼顾顾到到总总体体的的众众多多属属性性,而而只只考考虑虑到到几几种种;有有关关总总体体分分布布变变化化的的最最新新信信息息不不易易得得到到,其合理性很难保证。其合理性很难保证。4、滚雪球抽样滚雪球抽样(1 1) 方方法法:先先从从几几

32、个个合合适适的的调调查查对对象象开开始始,通通过过他他们们得得到更多的调查对象,然后一步步扩大样本范围。到更多的调查对象,然后一步步扩大样本范围。(2 2) 适适用用:当当调调查查总总体体的的个个体体信信息息不不充充分分时时,常常采采用用此此种方法。种方法。(3 3) 局局限限性性:最最后后仍仍有有多多个个个个体体找找不不到到,因因某某些些原原因因故故意漏而不提,产生遗漏。意漏而不提,产生遗漏。 八、样本容量的确定(一)样本容量:样本内所含个体数量的多少。(一)样本容量:样本内所含个体数量的多少。在在统统计计学学中中,有有所所谓谓大大样样本本、小小样样本本的的区区别别和和争争论论,原原因因在在

33、于于大大样样本本与与小小样样本本的的抽抽样样分分布布不不同同,因因而而需需要要采采用用不不同同的的统统计计分分析析方方法法。一一般般认认为为30个个以以上上称称为为大大样样本本。社社会会统统计计研研究究中中,则认为样本规模超过则认为样本规模超过100个才称为大样本资格。个才称为大样本资格。(二)计算方法:(二)计算方法:1.简单随机抽样中推论总体平均数的样本简单随机抽样中推论总体平均数的样本n其中:其中:t:置信度所对应的临界值:置信度所对应的临界值总体的标准差总体的标准差e:抽样误差:抽样误差 : 推论总体成数(百分比)的样本推论总体成数(百分比)的样本n计算计算公式公式其中:其中:p:为总

34、体成数或百分比,:为总体成数或百分比,t、e含义同上含义同上注意:注意:t t值可以从标准正态分布表中查出;值可以从标准正态分布表中查出;e e是研是研究者根据需要事先确定的;总体标准差,或者总究者根据需要事先确定的;总体标准差,或者总体成数或百分比常常难以得到,可采用下列变通体成数或百分比常常难以得到,可采用下列变通的方法:的方法:利用前人所作的关于同一总体的普查或抽样调查利用前人所作的关于同一总体的普查或抽样调查资料来计算或估计总体方差,由此得出推论总体资料来计算或估计总体方差,由此得出推论总体均值的样本规模;均值的样本规模;在计算推论总体成数(百分比)的样本规模时,在计算推论总体成数(百

35、分比)的样本规模时,可以取可以取p p1/21/2,p p(1 1p p)maxmax,则,可保证,则,可保证n n足足够大够大(三)影响样本规模的确定因素(三)影响样本规模的确定因素1 1、总体的规模:、总体的规模:当当总总体体规规模模大大到到一一定定程程度度时时,样样本本规规模模的的增增加加与与它它并并不不保保持持同同等等的的增增长长速速度度; ;在在其其它它有有关关因因素素一一定定时时, ,样样本本n n的的增增加加速速度度大大大大低低于于总总体体规规模模的的增增加加速速度;度;2 2、抽样的精确性、抽样的精确性(1 1)置信度越低,推论的可靠性越大,则要求的)置信度越低,推论的可靠性越

36、大,则要求的n n越大;越大;(2 2)在其它条件一定的情况下,置信区间越小,即)在其它条件一定的情况下,置信区间越小,即样本统计值与总体参数值之间的误差范围越小,样本统计值与总体参数值之间的误差范围越小,则则n n越大越大3、总体的异质性程度、总体的异质性程度(1 1)要达到同样的精确度,在同质性越强的总体)要达到同样的精确度,在同质性越强的总体中,则抽样中,则抽样n n小些;异质性强的样本,小些;异质性强的样本,n n大些。大些。(2 2)总体中的大部分成员对某个问题的回答或选)总体中的大部分成员对某个问题的回答或选择与小部分成员的回答或选择不同时,则择与小部分成员的回答或选择不同时,则n

37、 n小小些;当选择两种不同的回答的成员比例相差些;当选择两种不同的回答的成员比例相差无几时,无几时,n n大些大些4 4、研究者所拥有的经费、人力和时间、研究者所拥有的经费、人力和时间5 5、常见的经验样本量:、常见的经验样本量:民意调查中:民意调查中:一般:一般:1600-2000人,最多不超过人,最多不超过3000人人最重要的全国调查:最重要的全国调查:15-20万之间万之间不同总体规模下的经验样本量不同总体规模下的经验样本量总总体体规规模模100100以下以下100-1000100-10001000-50001000-50005000-100005000-1000010000-10100

38、00-10万万1010万以上万以上样样本占本占总总体的比重体的比重50%50%以上以上50%-20%50%-20%30%-10%30%-10%15%-3%15%-3%5%-1%5%-1%1%1%以下以下九、抽样误差九、抽样误差1.非抽样误差:人为操作失误所致:如调查方非抽样误差:人为操作失误所致:如调查方案设计不甚合理、抽样方法有违随机原则、案设计不甚合理、抽样方法有违随机原则、度量误差、在调查中的记录、填答、汇总等度量误差、在调查中的记录、填答、汇总等工作中出现的误差等,即非抽样误差。工作中出现的误差等,即非抽样误差。2.非抽样误差可通过研究者主观努力尽量减少,非抽样误差可通过研究者主观努力

39、尽量减少,但无法用计量方法计算出这种误差到底有多但无法用计量方法计算出这种误差到底有多大。大。3.抽样误差:就是在随机抽取样本过程中所产生抽样误差:就是在随机抽取样本过程中所产生的样本统计量与总体参数之间的差别;的样本统计量与总体参数之间的差别;它与抽样过程中的人为操作无关,而与总体的分它与抽样过程中的人为操作无关,而与总体的分布状况、样本容量及所采用的抽样方法等因素有布状况、样本容量及所采用的抽样方法等因素有关。关。大小是可以在样本设计中事先控制的;大小是可以在样本设计中事先控制的;4.抽样方法对抽样误差的影响:采用不同的抽样抽样方法对抽样误差的影响:采用不同的抽样方法抽取样本,所产生的误差

40、不一样;方法抽取样本,所产生的误差不一样;理论上应该选择抽样误差最小的方法抽取样本。理论上应该选择抽样误差最小的方法抽取样本。但实际研究工作中,抽样方法的选取受到多种因但实际研究工作中,抽样方法的选取受到多种因素的制约。素的制约。运用不同的随机抽样方法时,抽样误差的计算依运用不同的随机抽样方法时,抽样误差的计算依据不同的公式。据不同的公式。5.5.总体的分布状况与抽样规模对抽样总体的分布状况与抽样规模对抽样误差的影响:误差的影响:总体的分布状况是指研究总体中各元素的差总体的分布状况是指研究总体中各元素的差异程度或异质性程度。异程度或异质性程度。研究总体的异质性程度越大,抽样误差越大,研究总体的

41、异质性程度越大,抽样误差越大,反之抽样误差越小。研究总体的异质性程度反之抽样误差越小。研究总体的异质性程度与抽样误差成正比;抽取样本的规模与抽样与抽样误差成正比;抽取样本的规模与抽样误差成反比。误差成反比。统计学中,用总体的标准差表示总体异质性程统计学中,用总体的标准差表示总体异质性程度,用度,用n n表示样本规模,用表示样本规模,用SESE(sampling sampling errorerror)表示抽样误差,则:)表示抽样误差,则:由于总体标准差通常未知,用样本标准差由于总体标准差通常未知,用样本标准差S S代替,代替,则:则: 注意:以上公式是不考虑抽样方法这一因素的注意:以上公式是不

42、考虑抽样方法这一因素的影响时一般性地描述和反映研究总体的异质性影响时一般性地描述和反映研究总体的异质性程度及样本规模与抽样误差之间的数量关系。程度及样本规模与抽样误差之间的数量关系。当把抽样方法(如分层抽样方法、分阶段抽样当把抽样方法(如分层抽样方法、分阶段抽样方法等)考虑进来,则抽样误差的计算公式要方法等)考虑进来,则抽样误差的计算公式要根据抽样方法的不同进行修正或改变。根据抽样方法的不同进行修正或改变。简单随机抽样,可以通过扩大样本简单随机抽样,可以通过扩大样本n来来降低误差降低误差分层抽样,可通过缩小总体的异质性分层抽样,可通过缩小总体的异质性程度、总体分布的方差,提高精确度。程度、总体

43、分布的方差,提高精确度。6 6、注意:抽样规模与抽样误差之间的关、注意:抽样规模与抽样误差之间的关系问题系问题对比较小的样本来说,样本规模的很小的一对比较小的样本来说,样本规模的很小的一点增加,会带来精确性方面有很明显的增加点增加,会带来精确性方面有很明显的增加对于比较大的样本来说,同样增加这么多的对于比较大的样本来说,同样增加这么多的个案,收效甚微。个案,收效甚微。因此许多调查公司通常将他们的样本因此许多调查公司通常将他们的样本n限制限制在在2000之内,超过这一点,花费在增加的人之内,超过这一点,花费在增加的人力、力、物力等相对于增加估计的精确性来说,物力等相对于增加估计的精确性来说,有些得不偿失。有些得不偿失。练习题练习题

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号