人口普查数据评估方法

举报
资源描述
人口普查数据评估方法人口普查数据评估方法乔晓春,教授北京大学人口研究所2018年3月27日Evaluation Methods for Evaluation Methods for Census DataCensus DataXiaochunQiao,ProfessorInstituteofPopulationResearch,PekingUniversity27March2018人口普查数据人口普查数据:来自普查问卷上的各个问题或变量。具体涉及的内容包括:人记录(以人为单位登记):姓名、与户主关系、性别、出生年月(年龄)性别、出生年月(年龄)、民族、居住状况、识字状况、受教育状况、就业状况、婚姻状况、健康状况,(以及生育、死亡、迁移)等户记录(以户为单位登记):户类型、户规模、住房情况等。普查数据的特点:全人群数据(来自短表)和样本人群数据(来自长表)规模数据(人头数关注全人群是否全覆盖)和结构数据(比例数关注样本人群是否有偏差)静态(时点)数据和动态(时期)数据Census DataCensusdata:thequestionsorvariablesincensusquestionnaires.Inspecific,itincludes:Personalrecord(registrationwithpersonasunit):name,relationshipwiththeheadofhousehold,sex,date of birth(age),ethnicity,dwellingcondition,literacy,education,employmentsituation,maritalstatus,healthcondition,(andfertility,mortality,migration),etcHouseholdrecord(registrationwithhouseholdasunit):householdtype,householdscale,dwellingsituation,etc.Featuresofcensusdata:Wholepopulationdata(fromShortForm)andsamplepopulationdata(fromLongForm)Scaleddata(headcountfocusonwholepopulationwhethercompletecoverage)andstructuredata(proportionalnumberfocusonsamplepopulationwhetherhavingdeviation)Static(timepoint)dataanddynamic(period)data普查数据评估目的是检验普查数据质量,为后期的数据开发和分析提供支持。普查数据通常存在两类错误:漏报(omissions)和错报(errors)数据评估分两类方法:一个是对现场调查结果的评估,另一个是对普查已经得到的数据的评估。对现场调查结果的评估:通过事后质量抽查(postenumerationsurvey)来实现。它是通过独立抽取一定数量的普查区或被调查者,利用同样的方法、使用不同的调查员、对同样的人群进行重复调查,并将该区域的普查结果与事后调查结果进行比对,从中检验普查数据的质量对已经获得数据的评估(既可以从微观也可以从宏观上进行比对):外部一致性检验:它是将普查数据与其他来源的相关数据(包括接受教育人群数据、儿童接种免疫数据、社会保险或保障数据、医院登记数据等)进行比对;内部一致性检验:通过人口分析技术,将普查数据与以往人口普查、以往出生、死亡和迁移的生命登记数据,或与本次人口普查各项目间的一致性进行比较。两类评估,使用的方法不同、评估参照组也不同。Census Data EvaluationTocheckthequalityofcensusdata,andprovidesupportforlaterdatadevelopmentandanalysis.Normallytwotypesoffaultsexistincensusdata:omissions anderrorsTwomethodsofdataevaluation:1.evaluationoffieldsurveyresults;2.evaluationofdatacollectedinthecensus.Evaluationoffieldsurveyresult:realizedbypost-enumerationsurvey.Itindependentlyextractscertainamountofcensusblocksorrespondents,andsendsdifferentenumeratorstoconductrepeatedsurveystothesamepopulationwiththesamemethod,andcomparesthecensusdataoftheblockswithpost-enumerationsurveyresultstocheckthequalityofcensusdata.Evaluationofdatacollectedbythecensus(Comparisonfromthemicroormacroperspectivescanbeapplied):ExternalConsistencyCheck:Comparingcensusdatawiththerelevantdataofothersources(includingdataoneducatedpopulation,dataonchildrenvaccination,dataonsocialinsuranceorsecurity,dataonhospitalregistration,etc.);InternalConsistencyCheck:Applyingdemographictechniquestocomparecensusdatawiththepreviouspopulationcensusdataandpreviousdataonfertility,mortalityandmigration,orwiththeconsistencyoftheitemsofcurrentpopulationcensus.Thetwoevaluationsemploydifferentmethodsandevaluationreferencegroups.对现场调查结果的评估事后质量抽查(post-enumeration survey,PES)需要满足三个条件必须是独立于普查原始登记的另一个数据对全国或总体有代表性含有一对一的、对应的配对样本事后质量抽查需要获得两个不同的事后调查样本,群体(population)样本和登记(enumeration)样本(也可以整群调查)。群体样本:以群(普查区)为单位独立抽样,对群内所有人进行重新调查,目的是测量普查数据漏报(omissions)情况登记样本:以户或人为单位进行抽样,对被抽中户或人群进行调查,再与普查结果进行比对,目的是测量普查数据误差(errors)情况将事后得到的样本与普查登记的记录进行比对或匹配:事后登记数据=普查登记数据(Post-enumerationVSCensusenumeration)Evaluation of Field Survey Results:Post Enumeration Survey(PES)Theresultsneedtosatisfythreeconditions:mustbeanothersetofdataindependentoftheoriginalregistrationofthecensus;arerepresentativeofthewholecountryorwholepopulation;containone-to-oneandcorrespondingpairedsamples.PESneedstoobtaintwodifferentpost-surveysamples,i.e.populationsampleandenumerationsample(orclustersurvey).Populationsample:independentsamplingbytakinggroup(censusblock)asunit,toresurveyallthepeopleintheblocksoastomeasuretheomissionsincensusdata.Enumerationsample:samplingbytakinghouseholdorindividualasunit,tosurveytheselectedhouseholdsorindividualsandcomparewiththecensusresultssoastomeasureerrorsincensusdata.ComparingormatchingthePESsampleandthecensusenumeration:postenumerationVScensusenumeration事后登记数据 VS 普查登记数据目的是确认该区域真正的人口是多少。比对结果:所有人不是在普查登记数据里面,就是在外面;不是在事后登记里面就是在事后登记外面。绿色格子的数据是我们可以从两次调查中得到的数据,以外的数据我们是得不到的。假设两次调查的完全是独立的,那么就有:估计的人口总量为:进一步可以得到普查的净漏报数:N2+=N+-N1+,漏报率:N2+/N+事后登记普查登记总数在里面在外面总数N+N+1N+2在里面N1+N11N12在外面N2+N21N22N+=(N+1)(N1+)/(N11)PES Data VS Census Enumeration DataToconfirmthetruepopulationoftheblock.Resultofcomparison:allthepeopleareeitherincludedorexcludedinthecensusenumeration;eitherincludedorexcludedinpostenumeration.Thedataingreengridsarethosethatcanbegatheredfromthetwocensuses.Beyondthemdatacannotbeobtained.Assumethatthetwocensusesarecompletelyindependent,then:Estimatedtotalpopulation:Thecensusnetomissioncanbefurthergained:N2+=N+-N1+,omissionrate:N2+/N+PostenumerationIn censusOut of censusTotalN+1N+2In PESN11N12Out of PESN21N22N+=(N+1)(N1+)/(N11)中国和美国的普查漏报率情况中国历次人口普查年份漏报率(%)重报率(%)净 漏 报 率(%)错报率(%)1st,19530.2550.1390.1160.3942nd,19640.0390.0380.0010.0773rd,19820.0560.0710.0150.1274th,19900.0700.0100.0600.0805th,20001.816th,20100.12美国普查年份净漏报率(%)19501.4(CoalePES)3.5(普查局)19601.8(PES)2.5-3.1(Marksetal.)3.1(DA)19702.3(CPS)2.7(DA)19801.01.7(F)1.2(DA)19902.1(PES)1.8(DA)Census Omissions in China and the
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 办公文档 > 教学/培训


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号