样本量的确定方法.

上传人:s9****2 文档编号:499149453 上传时间:2023-12-05 格式:DOC 页数:7 大小:21KB
返回 下载 相关 举报
样本量的确定方法._第1页
第1页 / 共7页
样本量的确定方法._第2页
第2页 / 共7页
样本量的确定方法._第3页
第3页 / 共7页
样本量的确定方法._第4页
第4页 / 共7页
样本量的确定方法._第5页
第5页 / 共7页
点击查看更多>>
资源描述

《样本量的确定方法.》由会员分享,可在线阅读,更多相关《样本量的确定方法.(7页珍藏版)》请在金锄头文库上搜索。

1、样本量的拟定措施(-10-1 0:12:34) 一、样本单位数量的拟定原则 一般状况下,拟定样本量需要考虑调查的目的、性质和精度规定。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等波及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差别不是很大或对样本量规定不是很严格的调查,样本量相对可以少某些。事实上拟定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样措施等都决定样本量的大小。但是这只能原则上拟定样本量大小。具体拟定样本量还需要从定量的角度考虑。从定量的方面考虑,有具体的记录学

2、公式,不同的抽样措施有不同的公式。归纳起来,样本量的大小重要取决于:(1)研究对象的变化限度,即变异限度;(2)规定和容许的误差大小,即精度规定;(3)规定推断的置信度,一般状况下,置信度取为9;(4)总体的大小;()抽样的措施。 也就是说,研究的问题越复杂,差别越大时,样本量规定越大;规定的精度越高,可推断性规定越高时,样本量也越大;同步,总体越大,样本量也相对要大,但是,增大呈现出一定对数特性,而不是线形关系;而抽样措施问题,决定设计效应的值,如果我们设定简朴随机抽样设计效应的值是1;分层抽样由于抽样效率高于简朴随机抽样,其设计效应的值不不小于1,合适恰当的分层,将使层内样本差别变小,层内

3、差别越小,设计效应不不小于的幅度越大;多阶抽样由于效率低于简朴随机抽样,设计效应的值不小于,因此抽样调查措施的复杂限度决定其样本量大小。对于不同都市,如果总体不懂得或很大,需要进行推断时,大都市多抽,小都市少抽,这种说法原则上是不对的。事实上,在大都市抽样太大是挥霍,在小都市抽样太少没有推断价值。 二、样本量的拟定措施 如何拟定样本量,基本措施诸多,但是公式检查表白,当误差和置信区间一定期,不同的样本量计算公式计算出来的样本量是十分相近的,因此,我们完全可以使用简朴随机抽样计算样本量的公式去近似估计其她抽样措施的样本量,这样可以更快捷以便,然后将样本量根据一定措施分派到各个子域中去。因此,区域

4、二相抽样不能计算样本量的说法是不科学的。 .简朴随机抽样拟定样本量重要有两种类型:(1)对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列环节来计算所需要的样本量。已知盼望调查成果的精度(E), 盼望调查成果的置信度(L),以及总体的原则差估计值的具体数据,总体单位数。计算公式为:=2(e/2+/N)特殊状况下,如果是很大总体,计算公式变为:= Z2/e例如但愿平均收入的误差在正负人民币30元之间,调查成果在5%的置信范畴以内,其95的置信度规定Z的记录量为19。根据估计总体的原则差为10元,总体单位数为100。样本量:n=15*10(30*0/(1.96*1.6))0*150/10

5、00)=88(2)于比例类型的变量对于已知数据为比例,一般根据下列环节计算样本量。已知调查成果的精度值比例(),以及置信度(L),比例估计(P)的精度,即样本变异限度,总体数为N。则计算公式为:n=P(1P)(e2/Z2+ P(1-P)/)同样,特殊状况下如果不考虑总体,公式为:=Z2P(-P)/e2一般状况下,我们不懂得P的取值,取其样本变异限度最大时的值为0.5。例如:但愿平均收入的误差在正负.05之间,调查成果在95%的置信范畴以内,其5的置信度规定Z的记录量为.96,估计P为0.5,总体单位数为100。样本量为:n0.50.5/(005*.05/(1.996)+0.5*.51000)=

6、2782样本量分派措施以上分析我们获得了采用简朴随机抽样公式计算得到的样本量,总的样本量需要在此基本上乘以设计效应的值得到。由于样本总量已经拟定,我们采用总样本量固定措施分派样本,这种措施涉及按照比例分派和不按照比例分派两类。实际工作中一方面计算获得区县总的样本量,然后逐级将其分派到各阶分层中,如果不清晰各阶分层的规模和方差等,一般采用比例分派或者比例平方根分派法。如果有一定辅助变量可以使用,可以采用按照规模分派法分派样本量。3样本量和总体大小的关系: 在其他条件一定的状况下,即误差、置信度、抽样比率一定,样本量随总体的大小而变化。但是,总体越大,其变化越不明显;总体较小时,变化明显。其变化趋

7、势如下:两者之间的变化并非是线性关系。因此,样本量并不是越大越好,应当综合考虑,实际工作中只要达到规定就可以了。 三、抽样调查方案样本量的拟定 我们决定一方面采用简朴随机抽样的措施计算区县的样本量,之因此一方面对区县计算样本量,重要是考虑,虽然我们方案中没有规定对区县的估计量,但是区县一级是我们做筹划和决策的基本,具有承上启下的作用,如果区县级获得的估计量精度比较高,就可以保证上一级的估计量具有更高的精度,并且各个区县的样本量可以觉得是相似的,这重要是由于各个区县的总体数都比较多,并且我们也不清晰;同步也不也许事先进行区县方差估计。没有一方面计算区县如下各阶分层的样本量,重要是考虑: (1)如

8、果计算区县如下某阶分层的样本量,然后再将计算的样本量合并,将明显增长样本量,增长基层的承当。(2)事实上,对于计算阶可以比较好的得到它的估计量,但我们目前不需要得到区县如下各阶分层的估计量,我们仅仅需要区县的估计量,没有必要计算区县如下阶样本量。 (3)我们直接对整个区县以简朴随机抽样进行抽取,然后将其样本量合理分派到各阶分层中,这样可以使用较少样本量得到区县较好的估计量。如下我们以试点地区批零业为对象进行研究。由于没有误差限以及置信度和抽样比率的值。我们可以采用常用参数:设定区县总体为很大,置信度是95,抽样比率保守估计是05,抽样误差不能不小于15,根据公式计算得到样本量为43个。由于采用

9、多阶分层抽样,我们如何设定抽样设计效应呢?区县及如下是三阶分层抽样,只要在各阶进行合适的分层,其设计效应应当在23之间,我们在这里取保守值3,那么得到本区县样本量是个,这个样本量就可以根据新方案得到区县规定误差内的估计值。 .拟定办事处、居委会、村委会样本量根据方案,每个居委会抽取样本50个,那么这个样本量与否可行呢?这里波及如何将区县样本分派到街道和居委会中去,根据方案规定,街道抽取采用先分层,后对层内进行PPS抽样;那么分派样本与否也采用同样措施呢?重要看辅助变量与样本量之间的关联限度,方案中提供了两个辅助变量:人口数和个体数,对于辅助变量是个体数的完全可以使用规模分派措施分派样本量,个体

10、数多的分派较多的样本量;对于辅助变量是人口数的如果采用规模分派措施,由于人口数与一种地区的个体单位数没有必然的联系,也许导致某些居委会的个体数比较多,却分派了较少的样本量,使得居委会分层变的困难,同步使居委会方差明显增大。而获得较多样本量的居委会,分层的效果和方差提高幅度有限,故采用比例分派的措施也许更加合适某些。对于居委会村委会的抽取,由于本阶也许存在市场内的抽样,分派复杂某些;如果本阶有市场内抽样,可以合适减少居委会村委会的样本量,但应当不小于本阶样本量的80%,由于市场内抽样的特殊性,建议将本阶样本量所有分派给居委会村委会,我们所进行的试点就是将样本所有分派给居委会;至于市场内抽样的具体

11、实行,可以根据方案操作完毕。对居委会村委会层内,由于使用简朴随机抽样完毕,采用比例分派平均分派就可。在实际工作时,由于一种区县涉及所有乡镇街道或其中的一种;根据方案,区县抽取办事处的数量应当介于2-4个之间,相应于抽中乡、镇、街道的所有或其中一种,那么其每一种乡镇街道采用比例分派平均分派的样本量应当是11个之间;所抽中的居委会、村委会数量应当介于16-个之间,如果个别乡镇街道抽中的居委会是个,则其居委会总数相应减少某些;最后,每个居委会、村委会的样本量应当介于3-16个之间,大部分介于5-0之间。以上的讨论没有考虑总体的大小,如果考虑到居委会、村委会的总体有限,则每个居委会村委会的样本量可以减

12、少某些,具体可以采用如下公式得到具体样本量的调节数: 样本量=n1N/(Nn1)。N是本地区总体,n1 是给本地辨别配样本量 居委会样本量的调节数,应当作为本居委会样本量的底限。 拟定办事处、居委会村委会的样本量,与如下几点有关: a)估计量的误差、置信度,可以决定简朴随机抽样的样本量 b)与采用的抽样措施有关系,它决定了设计效应的大小。例如:分层抽样的设计效应值不不小于1,多阶抽样的设计效应值不小于1。可以决定整个抽样的样本量。 c)与每一阶的分层的数目有关系,因此,应当重点考虑分层的问题,分层太多,没有必要;分层太少,导致层内的方差增大,也许影响估计值的精度以及设计效应的值,因此,在每阶分

13、层时,应当合理考虑,使得样本的变异限度在层内达到一种合理水平。根据以上原则,我们在包头的抽样试点共抽取4个办事处,涉及1个居委会;一种乡,涉及4个村委会,通过清查共有批零业02个,单位0个;餐饮业250个,单位3个。由于我们使用人口数作为辅助变量,应当采用比例分派措施平均分派样本量,这样每个街道办事处得到6个样本, 对于抽取4个居委会的办事处,每个居委会分派得到7个样本;对于抽取2个居委会的办事处,每个居委会分派到个样本。然后根据居委会总体对样本量做出调节,得到居委会实际样本量。 2.拟定居委会村委会内分层样本量以上我们讨论如何分派给乡镇居委会村委会样本量,目前分析给居委会村委会如下各层分派样

14、本量,这一步,清查的工作就显得非常重要了,重点应当清查规模、类别,一方面是规模,规模的大小不应当根据工商注册为单位或个体决定,应当根据实际状况,虽然是个体,如果规模较大,也应当归入大规模分层中,这样就可以使得每层的样本变异限度明显减少,从而提高精确度。根据实际状况可以涉及两种: (1)如果所有是规模比较小的单位个体户,我们可以根据类别进行合适的分组,将某一类单位比较多的单独分层;将此外类别比较少的,可以几类合并进行抽取具体样本,分层不要多于4层,并保证每层的样本量不不不小于2个。由于居委会样本量数目已经拟定,我们可以直接采用比例分派措施,拟定各层样本量。 ()如果规模比较大的和规模小的并存,可

15、以将规模比较大的单独分层,不用考虑其中的类别;将规模较小的重要是个体户可以根据类别进行分层;其中的难题是如何将样本量在规模大的和规模小的之间分派,由于大规模层内样本变异限度有也许很大,应当抽取较多的样本量,通过测试,如果大规模层总体不不小于等于5,应当对其进行全面调查;如果不小于5个,可以采用如下的公式计算得到:n=025/(e2/t2 .5/),其中:e=30,=.1,N为规模较大的数目。 其她规模较小的,使用比例分派法分派其她的样本,实际分层时,最佳不要超过4层,保证每层不少于个,由于大规模层的存在,也许占去了较多的样本量,导致其他层不够分派,这种状况下,可考虑增长层内一定样本量。 通过以上的分析、计算可以得到居委会村委会的样本数量。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号