抽样调查-2简单随机抽样

上传人:wt****50 文档编号:53526853 上传时间:2018-09-02 格式:PPT 页数:80 大小:3.45MB
返回 下载 相关 举报
抽样调查-2简单随机抽样_第1页
第1页 / 共80页
抽样调查-2简单随机抽样_第2页
第2页 / 共80页
抽样调查-2简单随机抽样_第3页
第3页 / 共80页
抽样调查-2简单随机抽样_第4页
第4页 / 共80页
抽样调查-2简单随机抽样_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《抽样调查-2简单随机抽样》由会员分享,可在线阅读,更多相关《抽样调查-2简单随机抽样(80页珍藏版)》请在金锄头文库上搜索。

1、Chap 2 简单随机抽样,2.2 简单估计法(SE),2.1 定义与符号,抽 样 调 查,2.5 样本量的确定,2.6 其它相关问题,2.3 比率估计量,2.4 回归估计量,2018/9/2,2,2.1 定义与符号,一、定义与符号,(一)定义,上述抽样就称为不放回简单随机抽样,定义2.1:设有限总体共有N个单元,一次整批抽取n个单元 使得每个单元被抽中的概率都相等,任何n个不同单元的组合(样本)都有相同的概率被抽中, 这种抽样方法称为简单随机抽样法,所抽到的样本为 简单随机样本。,2018/9/2,3,定义2.2:(在具体实施过程中,)从总体中逐个等概率抽取单元(每次抽取到尚未入样的任何一个

2、单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样。,2018/9/2,4,定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.,上述三中定义其实是完全等价的,而定义2.2在 实际中容易实施 。,2018/9/2,5,例2.1 设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样的方式抽取容量为2的样本,则所有可能样本为,个,如表2.1。,表2.1 放回简单随机抽样所有可能样本,2018

3、/9/2,6,例2.2 上述总体按不放回简单随机抽样方式抽取容量 为2的样本,则所有可能样本为,个,如表2.2。,表2.2 不放回简单随机抽样所有可能样本,2018/9/2,7,(二)样本分布与符号,从总体,抽样单元。假设顺序被抽中的样本单元的号码为,(入样号码),则样本为,,称,为抽样比(Sampling fraction)。,中逐个不放回抽取n个,作为随机变量样本有什么分布呢?,2018/9/2,8,1 y1,yn同分布但不相互独立,其共同分布列为,2 ( yi, yj)的联合分布列均同(y1, y2 ),2018/9/2,9,表2.3符号,2018/9/2,10,二、抽样方法,(一)抽签

4、法,制作N个外形相同的签,将它们充分混合,然后一次抽 取n个签,或一次抽取一个但不放回,抽取n次得到n个 签。则这n个签上所对应号码表示入样的单元号。,例如:某中学为了解学生身体素质的基本状况,从全校N1200人中抽取一个简单样本n100人进行检查。,2018/9/2,11,1 随机数表,(二)随机数法,如上例,N1200,则在表中随机连续取四列,顺序往下, 选出前面100个不同(不放回抽样)的00011200之间的 数字。如果不够100个,可随机再取四列,同样操作,直至 抽取100个止。,2018/9/2,12,Simple random sampling,2018/9/2,13,Table

5、 of random numbers,2018/9/2,14,2 随机数骰子,随机数骰子是由均匀材质制成的正20面体,每个面上刻有 一个09的数字,且每个数字只出现在两个面上。要产生一 个m位数的随机数(如m4,N1200),则将m(m=4)个 颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子, 充分摇动盒子后,打开读出各色骰子的数字,即可得一个随机 数。重复上述过程,直至产生了n个满足条件的随机数。,2018/9/2,15,3 利用统计软件直接抽取法,大部分统计软件都有产生随机数的功能,快捷方便。 不过产生的是伪随机数,有一定循环周期的。简单 介绍一下利用EXCEL产生随机数的方法.,

6、2018/9/2,16,2018/9/2,17,2018/9/2,18,2018/9/2,19,2.2 简单估计法(SE),一、总体均值的估计,(一)简单估计定义,(2.6),(二)简单估计量的性质,引理2.1 从大小为N的总体中抽取一个样本容量为n的 简单随机样本,则总体中每个特定的单元入样的概率 为n/N,两个特定单元入样的概率为n(n1)/N(N-1)。,2018/9/2,20,引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令:,则:,2018/9/2,21,(二)简单估计量的性质,定理2.1上述简单估计是无偏的,即,定理2.2 上述简单估计的方差(均方误差)为:,.

7、(2.12/2.18),2018/9/2,22,证明(P35证法1对称证法):,为0,注意样本分布,2018/9/2,23,推论2.7,的无偏估计为,(2.25),证明:只须说明样本方差是总体方差的无偏估计即可。,注意,2018/9/2,24,例2.3 从某个N100的总体重抽取一个容量n=10 的简单随机样本,要估计总体平均水平,并给出 置信度为95的置信区间估计。如表2.4,序号,表2.4 简单随机样本指标,2018/9/2,25,2018/9/2,26,(三)有放回简单随机抽样的简单估计量,由于,故有放回抽样的精度低于不放回抽样的精度。,2018/9/2,27,说明:1 抽样调查中的估计

8、量与传统数理统计中估计量的区别(见表2.5),表2.5 抽样理论与传统数理统计关于样本均值性质异同比较,2018/9/2,28,2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。 3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大,即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。1f又被称为有限总体校正

9、系数。,2018/9/2,29,4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。,2018/9/2,30,二、总体总量的估计,(一)简单估计量,.(2.7),(二)估计量性质,推论2.1 2.4 2.8,.(2.13),.(2.19),.(2.26),2018/9/2,31,例2.4(续例2.3)估计总体总量,并给出置信度 为95条件下的估计相对误差 。,三、总体比例的估计,将总体分为两类,

10、一类具有该特征的单元A个, 另一类不具有该特征的单元NA个 。,调查的目的是估计,或A,若令,则,2018/9/2,32,(一)估计量的定义,(二)估计量性质,推论2.2 2.5 2.9对于简单随机抽样,p是P无偏估计。,p的方差为,方差的无偏估计, (2.27),(2.20),2018/9/2,33,例2.5某超市开张一段时间后,为改进销售服务环境, 欲调查附近几个小区居民到该超市购物的满意度。 该超市与附近一个小区的居委会取得联系,在总体中 按简单随机抽样抽取了一个大小为n=200人的样本。 调查发现对购物表示满意或基本满意的居民有130人, 估计对该超市购物环境持肯定态度的居民的比例,

11、并在置信度95%条件下,给出估计的绝对误差和置信 区间,假设抽样比可以忽略。,2018/9/2,34,(2)样本协方差是总体协方差的无偏估计.,(2.22,2.23),(2.29),考虑二维总体,2018/9/2,35,证明:仍采用对称法(P40证法1)(1),注意样本分布,注意为0,2018/9/2,36,(1)证法2: (构造性),展开,2018/9/2,37,(2),注意,由(1),2018/9/2,38,一、概念与作用(一)概念比率(Ratio)与比例(Proportion)区别(二)作用,2.3 比率估计量及其性质,一种场合是待估的总体参数R是两个变量比值。 如人口密度,恩格尔系数等

12、。,分子分母均为r.v.,分子为r.v.,2018/9/2,39,另一种应用场合,虽然待估的参数是某个研究变量的均值或总体总量,它本来可以通过样本均值加以估计,但是为了提高估计的效率,它通过引进一个辅助变量xi ,来计算比率,即,再通过这一比率乘以总体已知的辅助变量均值 或总量来达到估计的目的。,2018/9/2,40,二、应用条件,(1)辅助变量(auxiliary variable)资料易得或已知(2)辅助变量与目标变量之间存在高度相关性且相关性稳定。(3)样本量一般要求比较大,三、简单随机抽样下的比率估计,2018/9/2,41,(一)定义比率估计量(ratio estimator)又称

13、比估计。,(2.30),(2.31),2018/9/2,42,(二)比率估计的性质,引理2.3,定理2.6,推论2.11,2018/9/2,43,引理2.4,证:当n充分大时,2018/9/2,44,定理2.7,推论2.12,2018/9/2,45,因而方差估计 有两种思路,(2.39),(2.40),2018/9/2,46,例2.6,表4.1 假设的总体数据,2018/9/2,47,解:,2018/9/2,48,2018/9/2,49,解,2018/9/2,50,例2.7(P51例2.4),在二十世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数高达0.88,已知某IT企业474名员工的评鉴起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。数据如下:,,,,,2018/9/2,51,解:简单估计,95的置信区间,比率估计,95的置信区间,2018/9/2,52,例2.8某县在对船舶月完成的货运量进行调查,对运管部门登记的船舶台帐进行整理后获得注册船舶2 860艘,载重吨位154 626 吨。从2 860艘船舶中抽取一个n10的简单随机样本。调查得到样本船舶月完成的货运量及其载重吨位如表4.2(单位:吨)要估计该县船舶月完成货运量,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号