不等概率抽样详解演示文稿

上传人:太丑****片 文档编号:292145030 上传时间:2022-05-13 格式:PPT 页数:89 大小:5.82MB
返回 下载 相关 举报
不等概率抽样详解演示文稿_第1页
第1页 / 共89页
不等概率抽样详解演示文稿_第2页
第2页 / 共89页
不等概率抽样详解演示文稿_第3页
第3页 / 共89页
不等概率抽样详解演示文稿_第4页
第4页 / 共89页
不等概率抽样详解演示文稿_第5页
第5页 / 共89页
亲,该文档总共89页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《不等概率抽样详解演示文稿》由会员分享,可在线阅读,更多相关《不等概率抽样详解演示文稿(89页珍藏版)》请在金锄头文库上搜索。

1、不等概率抽样(chu yn)详解演示文稿1页,共89页,星期一。优选不等概率(gil)抽样2页,共89页,星期一。等概率的抽取样本(yngbn)医院的缺点?n首先,可能医院中愿意接受CPR治疗的病人数量会正比于医院床位的数量,采用等概简单估计量可能会有大的方差。n其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较(bjio)困难的。n第三,调查成本在调查开始的时候是未知的-一个40家医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。3页,共89页,星期一。其他(qt)办法?n调查人员还可以采用与医院病床数量成比例

2、的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。n如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率?n而且成本在调查实施前是已知的,因为(yn wi)每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。4页,共89页,星期一。n分层抽样:抽样选择概率(gil)小的单位会有较高的权数。n采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。n抽样的关键是每个样本的选择概率是已知的。 5页,共89页,星期一。5.1 不等概抽样(chu yn

3、)一、不等概抽样的必要性:一、不等概抽样的必要性:在简单随机抽样中,总体(或层)中的每个在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。单元入样的概率都相等。如果总体中的每如果总体中的每个单元在该总体中的地位个单元在该总体中的地位( (或重要性或重要性) )相差相差不多,则这种基于等概率的抽样是理所当不多,则这种基于等概率的抽样是理所当然的选择。等概率抽样不仅实施简单,而然的选择。等概率抽样不仅实施简单,而且相应的数据处理公式也简单。但是且相应的数据处理公式也简单。但是(dnsh)(dnsh)在许多实际问题中,我们还需要使用不等在许多实际问题中,我们还需要使用不等概抽样概抽样(sa

4、mpling with unequal (sampling with unequal probabilities)probabilities)。6页,共89页,星期一。二、不等概率抽样二、不等概率抽样(chu yn)(chu yn)的适用场合:的适用场合: 一种情况是调查的总体单元与抽样总体的单元可能不一致;一种情况是调查的总体单元与抽样总体的单元可能不一致; 另一种需要用到不等概抽样的情况是,抽样单元在总体中另一种需要用到不等概抽样的情况是,抽样单元在总体中所占的地位不一致;所占的地位不一致; 最重要最重要(zhngyo)(zhngyo)的一种不等概抽样乃是使每个单元入样的概率的一种不等概抽

5、样乃是使每个单元入样的概率与该单元的大小成比例的抽样与该单元的大小成比例的抽样(sampling with (sampling with probabilities proportional to sizesprobabilities proportional to sizes,简称,简称PPSPPS抽样抽样) )。 7页,共89页,星期一。二、不等概率二、不等概率(gil)(gil)抽样的适用场合:抽样的适用场合:第三种需用不等概率抽样的情况是为了改善估计第三种需用不等概率抽样的情况是为了改善估计量的特性。量的特性。 每个可能的样本若被抽的概率与样本中单元的每个可能的样本若被抽的概率与样本中

6、单元的辅助变量之和成正比的话,则按此进行辅助变量之和成正比的话,则按此进行(jnxng)(jnxng)不等概抽样所得到的样本,用通常的比估计方不等概抽样所得到的样本,用通常的比估计方法所得的估计量是无偏的。法所得的估计量是无偏的。8页,共89页,星期一。9 总总之之,在在实实际际工工作作中中需需要要我我们们经经常常采采用用不不等等概概率率抽抽样样。另另外外,从从上上面面列列举举的的情情况况也也可可看看到到,凡凡需需使使用用不不等等概概抽抽样样的的场场合合,必必须须提提供供总总体体单单元元的的某某种种辅辅助助信信息息,例例如如每每个个单单元元的的“大小大小(dxio)(dxio)”度量度量MiM

7、i或辅助变量或辅助变量XiXi等。等。 9页,共89页,星期一。10三、不等概抽样的主要(zhyo)分类 不不等等概概抽抽样样可可按按多多种种原原则则进进行行分分类类。鉴鉴于于不不等等概概抽抽样样同同时会带来目标量估计及其方差估计的复杂性,可分为时会带来目标量估计及其方差估计的复杂性,可分为 放放回回抽抽样样:每每次次在在总总体体(zngt)(zngt)( (或或层层) )中中按按一一定定概概率率抽抽取取一一个个单单元元,抽抽取取后后放放回回总总体体(zngt)(zngt),再再进进行行下下一一次次抽抽样样,每每次次抽抽样都是独立的。样都是独立的。 不不放放回回抽抽样样。其其代代价价是是:由由

8、于于丧丧失失了了独独立立性性,无无论论是是抽抽样样方法还是方差估计,都要比放回抽样繁复得多。方法还是方差估计,都要比放回抽样繁复得多。10页,共89页,星期一。11 另另一一种种分分类类是是:视视每每次次抽抽样样( (放放回回抽抽样样的的情情形形) )概概率率或或每每个个单单元元的的入入样样概概率率( (不不放放回回抽抽样样的的情情形形) )是是否否严严格格(yng)(yng)地地与与单单元元的的大大小小成成比比例例。另另外外,看看样样本本量量n n是是固固定定的的还还是是随随机机的的。最最重重要要的的情情形形乃乃是是当当n n固固定定,且且上上述述概概率率与与单单元元大大小小严严格格(yng

9、)(yng)成成比比例例的的不不等等概概率率抽抽样样。以以后后我我们们将将这这种种情情形形的的放放回回抽抽样称为样称为PPSPPS抽样,称相应的不放回抽样为抽样,称相应的不放回抽样为PSPS抽样。抽样。11页,共89页,星期一。12 对对于于不不放放回回抽抽样样,按按其其样样本本单单元元抽抽取取方方式式的的不不同同又又可可分为以下几种方法:分为以下几种方法: 1.1.逐逐个个抽抽取取法法。每每次次从从尚尚未未入入样样的的单单元元中中以以一一定定概概率率抽取一个单元,这个概率通常与已经入样的单元有关,抽取一个单元,这个概率通常与已经入样的单元有关, 2.2.重重抽抽法法。以以一一定定概概率率逐逐

10、个个进进行行放放回回抽抽样样,若若一一旦旦抽抽到到重重复复单单元元,则则放放弃弃所所有有(suyu)(suyu)已已抽抽到到的的单单元元而而重重新新抽抽取取,直直到到抽抽到规定单元数且所有到规定单元数且所有(suyu)(suyu)入样单元都不同为止。入样单元都不同为止。Back12页,共89页,星期一。13 3.3.系系统统抽抽取取法法。将将总总体体单单元元按按某某种种顺顺序序排排列列,且且将将规规定定(gudng)(gudng)的的单单元元入入样样(或或其其倍倍数数)累累计计起起来来,并并确确定定抽抽样样间间隔隔,在在这这个个范范围围内内产产生生一一个个随随机机数数以以确确定定初初始始入入样

11、样单单元元,然然后后按按上述抽样间隔确定其余的样本单元。上述抽样间隔确定其余的样本单元。 4.4.全全样样本本方方法法。对对每每个个可可能能样样本本规规定定一一个个被被抽抽中中的的概概率率,按这个概率一次抽取整个样本。按这个概率一次抽取整个样本。Back13页,共89页,星期一。四、不等概抽样的特点 不等概抽样的主要优点是:由于使用了辅助信息,提高了抽样策略的统计(tngj)效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。 不等概抽样有以下的缺点:1)抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;14页,共89页,星期一。n2)抽样框的创建比简单(jindn)随机

12、抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;n3)并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;n4)抽样及估计(特别对不放回抽样)相当复杂; n5)当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。 15页,共89页,星期一。5.2 放回不等概抽样(chu yn)一、多项抽样一、多项抽样(chu yn)(chu yn)与与PPSPPS抽样抽样(chu yn)(chu yn):1.1.多项抽样多项抽样: :16页,共89页,星期一。* *这种放回的不等概率这种放回的不等概率(gi

13、l)(gil)抽样为何又叫多项抽样?抽样为何又叫多项抽样?17页,共89页,星期一。2.PPS2.PPS抽样抽样(chu yn)(chu yn) :18页,共89页,星期一。19 2.PPS 2.PPS抽样抽样 PPSPPS抽抽样样是是与与大大小小(或或规规模模)成成比比例例的的概概率率抽抽样样,是是一种使用辅助信息从而使入样概率不相等的抽样技术。一种使用辅助信息从而使入样概率不相等的抽样技术。 如如果果总总体体(zngt)(zngt)单单元元的的大大小小或或规规模模变变化化很很大大,且且这这些些大大小小是是已已知知的的,这这样样的的信信息息就就可可以以用用在在抽抽样样中中,以以提提高高统统计

14、计效效率率。如如果果单单元元大大小小的的度度量量是是准准确确的的,而而且且所所研研究究的的变变量量与与单单元元的的大大小小相相关关,PPSPPS抽抽样样能能极极大大地地提提高高精精度度。但但如如果果大大小小的的度度量量不不大准确,最好按大小分组并使用分层抽样。大准确,最好按大小分组并使用分层抽样。19页,共89页,星期一。20 PPS PPS抽样的入样概率。如上所述,抽样的入样概率。如上所述,PPSPPS抽样时可取抽样时可取为为第第i i个个单单元元(dnyun)(dnyun)的的入入样样概概率率,其其中中 是是总总体体中中所所有有单单元元(dnyun)(dnyun)的的“大大小小”之之和和,

15、 为为第第i i个个单单元元(dnyun)(dnyun)的大小。的大小。20页,共89页,星期一。21 二、多项抽样的实施方法二、多项抽样的实施方法 如如何何抽抽取取(chu (chu q)q)一一个个不不等等概概率率样样本本呢呢?有有三三种种主主要要方方法法:代代码码法法、系系统统法法及及随随机机系系统统法法。以以下下的的讨讨论论以以PPSPPS抽抽样为例,并假定单元大小皆为整数。样为例,并假定单元大小皆为整数。21页,共89页,星期一。22 (1 1)代码法)代码法( (累计和法,随机法或汉森累计和法,随机法或汉森赫维茨法赫维茨法) ) 设设N N不不太太大大,且且 为为第第i i单单元元

16、大大小小的的度度量量,且且为为整整数数,对对总总体体中中的的每每个个单单元元计计算算累累计计大大小小,得得到到总总体体所所有有单单元元代代码码的的累累计计和和 ,对对总总体体中中每每个个单单元元确确定定与与它它相相对对应应的的代代码码范范围围;在在1 1到到总总的的累累计计大大小小 范范围围内内抽抽取取一一个个随随机机数数,该该随随机机数数相相应应(xingyng)(xingyng)的的代代码码范范围围中中的的单单元元即即为为入入样样单单元元。重重复复上上述述步步骤骤,直直到抽得到抽得n n个单元为止。个单元为止。22页,共89页,星期一。23PPSPPS抽样时,单元的代码抽样时,单元的代码(di m)(di m)如下表:如下表: 23页,共89页,星期一。24 (2 2)拉希里法(二次抽样法)拉希里法(二次抽样法) 代代码码法法要要将将 累累计计,在在N N不不太太大大时时是是适适用用的的,但但当当N N很很大大时时,就就很很不不方方便便。此此时时可可用用LahiriLahiri(拉拉希希里里)19511951年年提提出出的的方方法。法。 令令 每次抽取一个范围内的随机数每次抽取一个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 心得体会

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号