Neyman分配计算样本量之前课件

上传人:des****85 文档编号:302891506 上传时间:2022-06-02 格式:PPT 页数:66 大小:997.50KB
返回 下载 相关 举报
Neyman分配计算样本量之前课件_第1页
第1页 / 共66页
Neyman分配计算样本量之前课件_第2页
第2页 / 共66页
Neyman分配计算样本量之前课件_第3页
第3页 / 共66页
Neyman分配计算样本量之前课件_第4页
第4页 / 共66页
Neyman分配计算样本量之前课件_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《Neyman分配计算样本量之前课件》由会员分享,可在线阅读,更多相关《Neyman分配计算样本量之前课件(66页珍藏版)》请在金锄头文库上搜索。

1、2022/6/11第三章第三章 分分层层随机抽随机抽样样 第一节 分层随机抽样的定义、使用场合以及符号第二节 估计量及其性质(重点)第三节 样本量的分配原则(重点)第四节 样本量的确定第五节 分层抽样的若干问题2022/6/12第一节第一节 引引 言言一、定义l在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为 ,这个层合起来就是整个总体 ,然后,在每个层中分别独独立立地地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。l如果每层都是独立按照简单随机抽样进行,则称为分层随机抽样 不重不漏2022/6/13作用n分层抽样的抽样效率较高,也就是说分

2、层抽样的估计精度较高。这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。n分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。n层内抽样方法可以不同,而且便于抽样工作的组织。2022/6/14二、二、分层原则:总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。n1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。n2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。n3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。n

3、4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。2022/6/15例题n例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。n为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门负责省内的调查工作。n各省再将省内拥有的汽车按经济成分分层。n为提高抽样效率,再对汽车按吨位分层。n例如,某高校对学生在宿舍使用电脑的情况进行调查,根据经验,本科生和研究生拥有电脑的状况差异较大。n因此,在抽样前对学生按本科生和研究生进行分层是有必要的。2022/6/16三、符号说明三、符号说明 ( (关于第关于第h

4、 h层层的的记记号号 ) )n层号 单元总数样本单元数第个单元的值层权抽样比总体均值样本均值总体方差样本方差2022/6/17第二节第二节 估估 计计 量量一、一、对总对总体均体均值值的估的估计计n分分层样层样本本,总总体均体均值值 的估的估计计n分分层层随机随机样样本本,总总体均体均值值 的的简单简单估估计计 2022/6/18估计量的性质 n性性质质1 1:对于一般的分层抽样,如果 是 的无偏估计( ),则 是 的无偏估计。 的方差为:n只要对各层估计无偏,则总体估计也无偏。n各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。2022/6/19证明性质1 由于

5、对每一层有 因此, 估计量的方差 由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有 2022/6/110n 性质性质2:对于分层随机抽样, 是 的无偏估计, 的方差为: 2022/6/111证明性质2: 对于分层随机抽样,各层独立进行简单随机抽样,对每一层有 因此,由性质1,有 由第二章性质2,得 因此n 2022/6/112n 性性质质3:对于分层随机抽样, 的一个无偏估计为: 2022/6/113证明性质3: 对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质3,得 的无偏估计为: 因此, 的一个无偏估计为: 2022/6/114二、对总体总量的估计二、对总体总量的估计n

6、 总体总量 的估计为: n如果得到的是分层随机样本,则总体总量的简单估计为: 2022/6/1152.估计量的性质n性质性质4 4:对于一般的分层抽样,如果是 的无偏估计,则 是 的无偏估计。 的方差为:2022/6/116n性质性质5:对于分层随机抽样, 的方差为:2022/6/117n性质性质6 6:对于分层随机抽样, 的一个无偏估计为: 2022/6/118例例3.13.1 n调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。层层居民户居

7、民户总数总数样本户奶制品年消费支出样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252022/6/1192022/6/1202022/6/121 三、对总体比例的估计三、对总体比例的估计 n总体比例P的估计为: n估计量的性质 性质性质7:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:2022/6/122性质性质8:对于分层随机抽样,是的无偏估计,因而的方差为: 20

8、22/6/123性质性质9:对于分层随机抽样,的一个无偏估计为:2022/6/124例例3.23.2 n在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及估计的标准差。层层居民居民户总户总数数样本户拥有家庭电脑情况样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002022/6/125解:由上表可得,根据前面对各层层权及抽样比的计算结果,可得各层估计量的方差:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量

9、的标准差为:2022/6/126第三节第三节 样本量在各层的分配样本量在各层的分配 n 确定样本量:总的样本量,各层样本量n估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。n实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。 2022/6/127【例例3.1】n调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。2022/6/128层居民户总数权数方差常数分配与权数成比例

10、与正比12000.071624103324000.142166106737500.268205101123415000.53193102072022/6/129层居民户总数权数标准差常数分配与权数成比例与方差成比例与正比120000.220100604940230000.3301009011090350000.534100150141170估计方差3.863.093.1132022/6/130一、比例分配一、比例分配 n按各层单元数占总体单元数的比例,也就是按各层的层权进行分配.n对于分层随机抽样,这时总体均值的估计是自加权2022/6/131总总体体中中的的任任一一个个单单元元,不不管管它它

11、在在哪哪一一个个层层,都都以以同同样样的的概概率率入入样样,因因此此按按比比例例分分配配的的分分层层随随机机样样本本,估估计计量量的的形形式式特特别别简简单单。这这种种样样本也称为自加权的样本。本也称为自加权的样本。n总体比例的估计是 2022/6/132二、最优分配二、最优分配 (一)最优分配(一)最优分配n在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。2022/6/133n对所有层成立时, 达到极小 常数2022/6/134n简单线性费用函数,总费用由此得出下面的行为准

12、则,如果某一层n单元数较多n内部差异较大n费用比较省n则对这一层的样本量要多分配一些。2022/6/135(二)(二)Neyman(内曼)分配(内曼)分配n如果每层抽样的费用相同,最优分配可简化为n这种分配称为Neyman分配。这时, 达到最小。 2022/6/1362022/6/137例例3.33.3 n(续例3.1),如果样本量仍为40,则按比例分配和Neyman分配时,各层的样本量应为多少?n按比例分配时,各层的样本量为: 2022/6/138n对于Neyman分配, 2022/6/139某些层要求大于某些层要求大于100%100%抽样时的抽样时的修正修正 n 按最优分配时,有时抽样比f

13、较大,某个层的 又比较大,则可能出现按最优分配计算的这个层的样本量 超过 的情况。n实际工作中,如果第 k 层出现这种情况,最优分配是对这个层进行100%的抽样,即取 ,然后,将剩下的样本量 按最优分配分到各层。 2022/6/140第四节第四节 样本量的确定样本量的确定 n令 当方差 给定时 2022/6/141n当按比例分配时, n实际工作中,n的计算可以分为两步,先计算:n然后进行修正: 2022/6/142n当按Neyman分配时, 2022/6/143例例3.43.4 n(续例3.1),如果要求在95%置信度下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多

14、少? =2679 2022/6/144n当按Neyman分配时: 2022/6/145二、最优分配需要考虑费用时二、最优分配需要考虑费用时n给定V时2022/6/146给定C时2022/6/147三、总体参数为三、总体参数为P P的情形的情形 n当方差给定时,如果 都比较大,使得 ,则总样本量为 (一)按比例分配(一)按比例分配或者或者2022/6/148n(二)(二)Neyman分配分配n n计算样本量之前,需要对 作预估计。2022/6/149例例3.53.5 n(续例3.1),如果要求在95%置信度下,绝对误差不超过5%,则按比例分配和Neyman分配时,总样本量分别为多少?n按比例分配

15、时:2022/6/150nNeyman分配时:2022/6/151第五节第五节 分层时的若干问题分层时的若干问题 一、抽样效果分析一、抽样效果分析n通常分层抽样比简单随机抽样的精度要高.n对于固定样本量的情况,如果 相对1可以忽略n如果各如果各层层均均值值差异越大,差异越大,则则采用按比例分配的方式采用按比例分配的方式较较好好; ;n而当各而当各层层的的标标准差相差很大准差相差很大时时,则则最最优优分配更好。分配更好。n在在调查调查多个目多个目标变标变量量时时,按比例分配的分,按比例分配的分层层抽抽样样可能更好些。可能更好些。2022/6/1522022/6/153二、层的划分二、层的划分(一

16、)最优分层(一)最优分层n按按调调查查目目标标量量进进行行分分层层当当然然是是最最好好的的,但但我我们们在在调调查查之之前前并并不不知知道道的的值值,因因此此,分分层层只只能能是是通过与通过与高度相关的辅助指标高度相关的辅助指标来进行。来进行。n累累积积平平方方根根法法: :戴戴伦伦纽纽斯斯(Dalenius)(Dalenius)与与霍霍捷捷斯斯(Hodges)(Hodges)提提出出的的,它它的的做做法法是是将将分分层层变变量量(例例如如)分分布布的的累累积积平平方方根根进进行行等等分分来来获获得得最最优优分分层层, 2022/6/154例例3.63.6 n某地区电信部门在对利用电话上网的居民家庭安装ADSL意愿进行调查时,以辖区内最近三个月有电话上网支出的居民用户为总体(上网电话费为0.02元/分钟),并准备按上网电话费支出进行分层,试确定各层的分点。2022/6/155范围频数累计0565328255.5934255.593451089240298.7306554.3241101536128190.0737744.3977152077525278.43311022.8312025

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号