工业抽样推算操作手册

上传人:人*** 文档编号:562263045 上传时间:2022-09-16 格式:DOC 页数:22 大小:71.50KB
返回 下载 相关 举报
工业抽样推算操作手册_第1页
第1页 / 共22页
工业抽样推算操作手册_第2页
第2页 / 共22页
工业抽样推算操作手册_第3页
第3页 / 共22页
工业抽样推算操作手册_第4页
第4页 / 共22页
工业抽样推算操作手册_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《工业抽样推算操作手册》由会员分享,可在线阅读,更多相关《工业抽样推算操作手册(22页珍藏版)》请在金锄头文库上搜索。

1、规模以下工业抽样调查推算操作手册(年报和半年报)年报和半年报采用的样本是一致的,在数据处理上的唯一区别是在年报调查中,企业部分多“实收资本”等7个调查指标,下面以年报数据为例来阐述用STATA软件进行总量和方差推算的方法和步骤,在半年报中,只需要在企业部分少推算“实收资本”等7个调查指标即可。一、数据转换用Stata/Transfer将基层表Foxpro数据库转换成Stata数据集。二、目录企业总量和方差推算步骤第一步,给基层表数据集赋予基础权数。通过将基层表数据集和样本数据集进行横向合并来对基层表数据集赋予基础权数。在进行两个数据集横向合并之前,必须确保两个数据集中的观察记录是一一对应关系,

2、换句话说就是,通过变量“qyfrdm”能够实现两个数据集之间的完全匹配。两个数据集的观察记录是否一一对应,可以从横向匹配的结果中看出。use n01_nb.dta, clearsort qyfrdmsave n01_nb.dta, replaceuse yb_mlqy*.dta, clearkeep qyfrdm bs code total_c samp_c weightsort qyfrdmmerge qyfrdm using n01_nb.dtacount if _merge!=3local nonqys=r(N)if nonqys0 display 基层表数据集和样本数据集有部分企业不对

3、应!list qymc qyfrdm _merge if _merge!=3clearelse drop _mergesave mlqy*.dta, replace说明:上述命令中包含的“*”表示省代码,下同;将赋予了基础权数的基层表数据集保存成mlqy*.dta是为了使n01_nb.dta不发生任何改变,便于数据管理。第二步,新增一个变量并命名为dws,作为有效样本单位和无效样本单位 有效样本单位和无效样本单位的定义参见规模以下工业抽样调查设计。的标识变量,用于估计企业数。变量dws的赋值方法为:有效样本单位赋值为1,无效样本单位赋值为0。use mlqy*.dta, cleargen dw

4、s=1replace dws=0 if reason=2save mlqy*.dta, replace第三步,根据样本企业回答情况,对样本企业的基础权数进行调整。如果没有无回答样本企业,则不需要进行权数调整;如果最终层内只有少数样本企业无回答,则在最终层内部进行权数调整;如果最终层内绝大部分样本企业无回答,则首先需要进行最终层合并,然后在合并层内进行权数调整。权数调整的范围是最终层(或合并层)内的有效样本。调整权数的具体方法参见规模以下工业抽样调查方案。为了保存权数调整过程,需要新增一个变量(baseweight)保存基础权数,将调整后的权数保存在变量weight中。需要注意的是,只能调整基层

5、表数据集中的权数,不能调整样本数据集中的权数,因为本次调查中的无回答企业,在下次调查中仍然要作为样本企业进行调查,并按照在当次调查中是否回答调查表决定是否进行权数调整。(下同)例一(最终层内有少数样本企业无回答情况举例):某省发现有1个无回答样本企业,其的基础权数为20,层代码为10611,该层中共抽取了5个样本,假设剩下4个样本企业都是有回答的有效样本企业,则调整因子为5/4,4个有回答的样本企业的权数被调整为20*5/4=25,同时,将那个无回答样本企业的权数调整为“0”。use mlqy*.dta, cleargen baseweight=weightreplace weight=bas

6、eweight*5/4 if code=10611replace weight=0 if code=10611 & reason=1save mlqy*.dta, replace例二(最终层内有多数样本企业无回答情况举例):某省发现4个无回答企业,都来自于同一层,层代码为10611,其基础权数都为20,该层中共抽取了5个样本企业,此时,需要将该层中剩下的1个有回答的有效样本企业与临近的层合并后,再进行权数调整。比如有一个临近的层代码为10621,该层中共抽取了5个样本企业,基础权数为10,但其中有1个样本企业消亡,属于无效样本企业。将层代码10611替换成10621,然后在合并层10621内对

7、5(=1+4)个有回答的有效样本企业的权数进行调整,调整因子为,原来属于层10611的1个有回答的有效样本企业的权数调整为20*14/6=46.67,原来属于层10621的4个有回答的有效样本企业的权数调整为10*14/6=23.33。同时,将4个无回答样本企业的权数调整为“0”。由于设置fpc要求fpc标识变量(total_c)在同一层内取值相同,因此,需要对合并层内观察记录的fpc标识变量(total_c)进行调整,调整为合并前两个层的total_c之和,即20*5+10*5=150。use mlqy*.dta, cleargen baseweight=weightreplace code

8、=10621 if code=10611replace weight=baseweight*14/6 if code=10621 and dws=1replace weight=0 if code=10621 & reason=1gen basetotal=total_creplace total_c=150 if code=10621save mlqy*.dta, replace第四步,在基层数据中设置抽样设计信息。use mlqy*.dta, clearsvyset strata codesvyset pweight weightsvyset fpc total_csave mlqy*.d

9、ta, replace说明:是否设置“有限总体校正系数(fpc)”只会影响方差估计值的大小。当每个最终层的抽样比都比较小,即每个最终层的权数都比较大时,是否设置“有限总体校正系数(fpc)”对推算结果的影响不大,但是,当有些最终层的抽样比比较大,特别地,当有全选层,即抽样比等于1,权数等于1 时,需要设置“有限总体校正系数(fpc)”,否则会高估方差。因此,统一要求设置“有限总体校正系数(fpc)”。在STATA中,设置“有限总体校正系数(fpc)”有两种方法,一是将最终层的总体单位数(total_c)设置成“有限总体校正系数(fpc)”,二是将最终层的抽样比设置成“有限总体校正系数(fpc)

10、”,两种设置方法得到的结果是一致的。要求统一采用第一种方法。第五步,进行总量和方差估计(包括估计企业数及其方差)。首先,需要将各调查指标的计量单位转换成万元,a01(全部从业人员期末数)除外;第二,计算各指标的样本汇总值;第三,估计企业数及各调查指标的总量和方差。use mlqy*.dta, clearfor var a*:replace X=X/10replace a01=a01*10egen hz00=sum(dws)egen hz01=sum(a01)egen hz02=sum(a02)egen hz03=sum(a03)egen hz04=sum(a04)egen hz05=sum(a

11、05)egen hz06=sum(a06)egen hz07=sum(a07)egen hz08=sum(a08)egen hz09=sum(a09)egen hz10=sum(a10)egen hz11=sum(a11)egen hz12=sum(a12)egen hz13=sum(a13)egen hz14=sum(a14)egen hz15=sum(a15)svytotal dws a*第六步,制综合表方法一:首先,编写STATA命令文件(do-file),将推算结果保存到一个STATA数据集中,然后将此STATA数据集用Stata/Transfer转换成Foxpro数据库文件,导入到规

12、模以下工业抽样调查数据管理系统中,制表输出。方法二:用EXCEL制表。具体方法为:在STATA结果窗口中选中推算结果表,在EDIT菜单中选用“copy table”功能复制推算结果表,然后打开一个EXCEL文件,执行“粘贴”操作,即将STATA的推算结果拷贝到EXCEL中了,最后在EXCEL文件中计算相对误差(STATA推算结果中没有计算相对误差的参数选项),并编辑制表。举例说明将推算结果保存在一个STATA数据集中的过程。首先,按照综合表的变量结构构造一个数据集;然后,将系统自动保存在内存距阵变量e(est)、e(V_db)等中的推算结果,逐个地存放到数据集的指定位置。use mlqy*.d

13、ta, clearfor var a*:replace X=X/10replace a01=a01*10egen hz00=sum(dws)egen hz01=sum(a01)egen hz15=sum(a15)svytotal dws a*matrix point=e(est)matrix variance=e(V_db)replace smc=(省名称)gen str2 sdm=(省代码)keep smc sdm hz00 hz01 hz02 hz03 hz04 hz05 hz06 hz07 hz08 hz09 hz10 hz11 hz12 hz13 hz14 hz15order smc

14、sdm hz00 hz01 hz02 hz03 hz04 hz05 hz06 hz07 hz08 hz09 hz10 hz11 hz12 hz13 hz14 hz15gen a00=.gen jfc00=.gen xdw00=.gen a01=.gen jfc01=.gen xdw01=.gen a02=.gen jfc02=.gen xdw02=.gen a03=.gen jfc03=.gen xdw03=.gen a04=.gen jfc04=.gen xdw04=.gen a05=.gen jfc05=.gen xdw05=.gen a06=.gen jfc06=.gen xdw06=.gen a07=.gen jfc07=.gen xdw07=.gen a08=.gen jfc08=.gen xdw08=.gen

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号