{品质管理抽样检验}抽样技术第三章

上传人:冯** 文档编号:140267529 上传时间:2020-07-28 格式:PPTX 页数:99 大小:1.82MB
返回 下载 相关 举报
{品质管理抽样检验}抽样技术第三章_第1页
第1页 / 共99页
{品质管理抽样检验}抽样技术第三章_第2页
第2页 / 共99页
{品质管理抽样检验}抽样技术第三章_第3页
第3页 / 共99页
{品质管理抽样检验}抽样技术第三章_第4页
第4页 / 共99页
{品质管理抽样检验}抽样技术第三章_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《{品质管理抽样检验}抽样技术第三章》由会员分享,可在线阅读,更多相关《{品质管理抽样检验}抽样技术第三章(99页珍藏版)》请在金锄头文库上搜索。

1、2020/7/28,1,第三章 分层随机抽样,3.1 概述 3.2 简单估计量及其性质 3.3 比率估计量及其性质 3.4 回归估计量及其性质 3.5 各层样本量的分配 3.6 总样本量的确定 3.7 分层抽样的其他方面,2020/7/28,2,第一节 概述,2020/7/28,3,定义3.3 分层随机抽样(stratified random sampling):如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样,所得的样本称为分层随机样本(stratified random sample)。,2020/7/28,4,2020/7/28,5,二、作用,由于每层

2、都进行抽样,这就可使样本在总体中分布更加均匀,从而具有更好的代表性。 由于抽样在每一层中独立进行,所以一者允许各层选择不同的适合本层的抽样方法,二则可同时对各子总体(层)进行参数估计,而不单是对整个总体的参数进行估计。 由于各层的总体方差因单元之间差异小而肯定小于整个总体的方差,而抽样精度与此成正比,所以分层抽样可以提高参数估计的精度。,三、符号,2020/7/28,6,所有总体参数的估计量都采用下标“st”以示区别:,2020/7/28,7,2020/7/28,8,第二节 简单估计量及其性质,一、对总体均值的估计 分层样本,总体均值 的估计 分层随机样本,总体均值 的简单估计,2020/7/

3、28,9,估计量的性质,性质1高管层人员总数N2=84名,该类职员进入公司时工资总额为X2=2 541 660元。经过分层随机抽样调查所得的数据如表35所示。请对上述数据分别按照分别比估计、联合比估计、分别回归估计、联合回归估计以及差估计方法对该公司当前职员工资总额Y做出估计,同时计算出各个估计量的精度。,五种估计方法结果比较,注意:此时的比估计和回归估计(回归系数采用样本回归系数进行估计)均为有偏估计,并且考虑到各层的样本量都不大,回归估计的偏倚有可能更大,所以此时采用比估计,特别是联合比估计会更保险。 而差估计虽然标准差相对较大,但它却是无偏的,均方误差并不一定大,所以仍然有采用的价值。,

4、3.4.4 比率估计与回归估计小结,在分层随机抽样中,当辅助变量可加以利用时,为了提高估计量的精度,可以采用分别比估计、联合比估计、分别回归估计以及联合回归估计等估计方法。 在比估计中, 当各层样本量都较大时,分别比估计与联合比估计近似无偏;当某些层的样本量不够大,而总样本量较大时,联合比估计近似无偏。 在回归估计中,少数情况下,回归系数可以是事先设定的常数,其估计量无偏;多数情况下,回归系数需利用样本回归系数进行估计,其估计有偏,但在大样本的情况下近似无偏。 当Y与X高度相关时,分别比估计、联合比估计、分别回归估计以及联合回归估计等估计等产生的估计量都是有效的。,选择估计方法,大致需遵循的原

5、则,在选择估计方法时,大致需遵循下面的原则: (1)由于分别估计(无论是分别比估计还是分别回归估计)要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用联合估计 (2)当回归系数需要由样本进行估计时,回归估计量是有偏的。 在这种情况下,采取比估计尤其是联合比估计也许更保险 (3)如果各层的样本量都比较大,同时每层的比估计或回归估计也比较有效(即h均比较大),而且各层的Rh之间(或h之间)差异较大,则此时分别估计优于联合估计,估计量的方差更小,(4) 如果各层的样本量不大,而且各层的Rh之间(或h之间)差异较小,则采用联合估计较为适宜 (5) 如果各层的Rh之间(或h之间)差别不是太

6、大,而且并不是每层的样本量都相当大,则联合估计可能更保险一些 如果各层的回归系数都接近于1,则可以采用差估计。虽然有时差估计量的方差偏大,但由于它为无偏估计量,所以总的均方误差不一定大,2020/7/28,61,第五节 各层样本量的分配,确定样本量:总的样本量,各层样本量 估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。,实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。,2020/7/28,62,2020/7/28,63,一、比例分配,按各层单元数占总体单元数的比例,也就是按各层的层权进行分配. 对于分层随机抽样,这

7、时总体均值的估计是,自加权,2020/7/28,64,总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的形式特别简单。这种样本也称为自加权的样本。,总体比例的估计是,2020/7/28,65,二、最优分配,(一)最优分配 在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。,2020/7/28,66,2020/7/28,67,2020/7/28,68,定理3.7的证明,对所有层成立时, 达到极小,常数,2020/7/28,69,简单线

8、性费用函数,总费用 由此得出下面的行为准则,如果某一层 单元数较多 内部差异较大 费用比较省 则对这一层的样本量要多分配一些。,2020/7/28,70,三 Neyman(内曼)最优分配,如果每层抽样的费用相同,最优分配可简化为 这种分配称为Neyman分配。这时, 达到最小。,2020/7/28,71,例3.4,某市有甲、乙两个地区,现要进行家庭收入的调查。令n=500,已知甲地区共有20 000户居民,乙地区共有50 000户居民;甲地居民和乙地居民年收入标准差估计分别为S1=2 500,S2=2 000;同时对甲地和乙地每户的平均抽样费用之比为23,请分别计算出在甲地和乙地进行比例分配、

9、一般最优分配(考虑费用因素)以及内曼分配(不考虑费用因素)的样本量。,2020/7/28,72,2020/7/28,73,2020/7/28,74,四、某些层要求大于100%抽样时的修正,按最优分配时,有时抽样比f较大,某个层的 又比较大,则可能出现按最优分配计算的这个层的样本量 超过 的情况。 实际工作中,如果第 k 层出现这种情况,最优分配是对这个层进行100%的抽样,即取 ,然后,将剩下的样本量 按最优分配分到各层。,五、偏离最优分配时对精度的影响,2020/7/28,75,例3.6,2020/7/28,76,2020/7/28,77,2020/7/28,78,第六节 总样本量的确定,令

10、 当方差 给定时,2020/7/28,79,当按比例分配时, 实际工作中,n的计算可以分为两步,先计算: 然后进行修正:,2020/7/28,80,当按Neyman分配时,,2020/7/28,81,2、精度要求是以 的绝对误差限d(在给定的置信水平1-下)的形式给出的,2020/7/28,82,2020/7/28,83,3.精度要求以 的相对误差限r(在给定的置信水平1-下)的形式给出,2020/7/28,84,2020/7/28,85,例3.7,2020/7/28,86,2020/7/28,87,2020/7/28,88,2020/7/28,89,二、总费用给定时总样本量的确定,给定V时,

11、2020/7/28,90,给定C时,2020/7/28,91,第七节 分层抽样的其他方面,一、多重分层 定义当调查指标与两个或多个辅助变量x1,x2,都存在相关关系时,为了提高分层的效益,需要按每一个辅助变量进行分层,通常的做法是先按最主要的变量分成大层,在大层中再按第二主要变量分成子层,从而形成交叉分层。当存在多个分层变量时,这种分层方式即称为多重分层(multiple stratification)。,对于多重分层,当“子层”划分好以后,就要考虑样本量在各子层的分配问题。最简单常用的样本量分配方法是按照与每一子层大小成比例的原则进行分配。 在多重分层中,有时会出现这样一个问题:当总样本量n

12、相对于子层总数RC不够大时,会出现某些子层分配不到样本的情况。 若nmax (R,C),则此时应当考虑重新确定分层变量或者不采用分层抽样,否则这种分层的效益是很难保证的。 若nRC,同时还满足nmax (R,C),就可以考虑用试验设计的思想来进行样本量的分配。,2020/7/28,92,2020/7/28,93,二、事后分层,实际工作中,有时进行事先分层会存在一定的困难 各层的抽样框无法得到 几个变量都适合于分层,要进行事先的交叉分层比较困难,并且我们并不需要交叉分层后每个子层的估计 一个单位到底属于哪一层要等到样本数据收集到以后才知道 总体规模N太大,事先分层太费事等,事后分层技术要求层权W

13、h已知或者可以通过某种途径获得,当层权Wh未知而需要进行估计时,应当确保层权的估计值与实际的层权相差甚小,否则将达不到提高估计量精度的目的。 同时,在使用事后分层技术时还应该注意“事后层”的数目不宜太多。,2020/7/28,94,事后分层的具体实施办法,2020/7/28,95,2020/7/28,96,2020/7/28,97,简单随机样本,事后分层落到第层的样本量nh,nh固定并都大于0的条件下,n足够大时,为无偏估计,2020/7/28,98,第一项就是按比例分配分层抽样估计量的方差,第二项表示因事后分层而非事先按比例分配分层引起的方差增加量 只要样本量足够大,事后分层的精度与按比例分配事先分层的精度相当,2020/7/28,99,如果样本是按某一个辅助指标分层后抽取的,只要这个事先分层抽样是严格按比例分配进行的,则这个样本是自加权的,总体中每个单元被抽中的概率相同,我们可以将这个样本看作简单随机样本,分别对其它指标进行事后分层估计。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号