中国政府统计数据质量研究[共13页](1)

上传人:新** 文档编号:495907546 上传时间:2023-12-14 格式:DOC 页数:13 大小:52KB
返回 下载 相关 举报
中国政府统计数据质量研究[共13页](1)_第1页
第1页 / 共13页
中国政府统计数据质量研究[共13页](1)_第2页
第2页 / 共13页
中国政府统计数据质量研究[共13页](1)_第3页
第3页 / 共13页
中国政府统计数据质量研究[共13页](1)_第4页
第4页 / 共13页
中国政府统计数据质量研究[共13页](1)_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《中国政府统计数据质量研究[共13页](1)》由会员分享,可在线阅读,更多相关《中国政府统计数据质量研究[共13页](1)(13页珍藏版)》请在金锄头文库上搜索。

1、中国政府统计数据质量研究:一个文献综述赵学刚,王学斌,刘康兵2011-03-23摘要:近年来,中国政府数据统计质量问题日益受到国内外学者的关注,相应的研究文献大量涌现,研究主要集中在统计数据质量的含义和衡量标准、统计数据失真的作用机理、统计数据质量控制技术、评估方法和管理理论,同时还有针对中国统计数据质量进行实证方面的评估以及改进统计数据质量的政策建议方面的讨论。本文在回顾现有文献基础上,指出要从根本上解决我国政府统计数据失真问题,还得从改革现行的统计管理体制入手,摆脱地方政府干扰,确保统计独立性,同时认为在现行框架下增加诸如消费价格指数权重、房屋销售价格及房价指数、固定资产投资等指标的统计透

2、明度可以在很大程度上避免当前很多对中国政府统计数据不必要和不公正的质疑。关键词:统计数据,数据质量,理论研究,经验证据一、引言2010年2月25日,国家统计局发布的2009年国民经济和社会发展统计公报显示,2009年全国70个大中城市房屋销售价格上涨1.5%。而根据2010年1月19日国家统计局公布的2009年全国房地产市场数据,相比前一年均价上涨约24%。2009年广大居民普遍感觉房价疯涨,出于与实际感觉的巨大反差,网民对当年“70个大中城市房屋销售价格上涨1.5%”的数据提出了大量质疑。国家统计局城市司2010年2月28日不得不公布了该数据的统计调查方案予以回应,以说明两套数据计算方法的差

3、异。其实中国政府统计数据质量问题一直存在,早在1988年Perkins就提出了中国经济增长率可能存在上偏误差的问题。2001年美国匹兹堡大学Rawski教授先后发表两篇文章,几乎是全方位地对官方公布的中国经济增长数据表示高度的质疑(Rawski,2001a,2001b)。这一论断与著名的美国经济学家克鲁格曼(Paul Krugman)此前的疑虑遥相呼应,素有“国际经济乌鸦”之称的他曾经说过,“中国经济数据,是一堆不可置信的符号体系。看中国的经济增长数据,就像看一部科幻小说。”2002年,中国经济改革研究基金会国民经济研究所副所长王小鲁针对我国经济增长统计的准确性指出了两个“正常”和两个“不正常

4、”,即二十世纪八九十年代以来我国经济结构的调整和生产效率的提高导致“经济增长快于能源增长应当是正常的,但经济增长在某些时间段或某些年份与能源增长发生找不到原因的重大偏离甚至反向变动,是不正常的”;经济体制改革导致“综合要素生产率的一定程度上升是正常的,而没有原因的突然大幅度跃升是不正常的”。关于消费价格指数(CPI)、平均工资、房价、失业数据、城镇化数据、居民收入数据、第三产业数据、房地产投资等统计数据被国家统计局搞得一片纷乱,经常存在不一致性,很难让人信服。最近,中国统计数据体系正在受到越来越多的质疑和拷问。随着中国经济结构的转型,我国的统计体系要从以制造业特别是工业生产为主的统计调整到涵盖

5、商品消费、服务业、城市化水平等指标在内的全方位统计。改革三十多年来,中国的统计体系已经发生了很大的变化,统计部门也做出了很多努力。但总体看来,统计体系严重滞后于经济发展现实,统计工作显然还有更大的改进余地,而且当下更显迫切。中国下一步要改善经济增长质量、改善宏观经济决策、进一步深入改革和完善市场经济体制,其中一个很重要的环节就是要改革现有的经济统计体系,这就必须要涉及到统计部门的改革。由于现有的关于这个主题的文献很多,评述所有学者的贡献几乎是一件不可能完成的事情,因此,笔者只回顾了其中极具影响力的文献(当然,疏漏也在所难免),根据“理论实证政策”这一主线对其进行梳理,希望本文能够引起学界和业界

6、对中国统计体系的关注及其改革方向和对策的讨论。本文余下部分结构安排如下:第二部分研究了统计数据质量理论方面的内容,第三部分研究了统计数据质量评估的经验证据,第四部分研究了改进统计数据质量的对策,第五部分是一个简单的小结。二、统计数据质量的理论研究目前国际上针对统计数据质量还没有一个统一的定义,不同的学者也有各自不同的定义。总的来说,从用户、生产者和被调查者三个角度考察,衡量统计数据质量的标准共有11个,即适用性、准确性、及时性、可比性、可衔接性、可取得性、可解释性、客观性(或诚信)、方法专业性(或健全性)、有效性、减轻调查负担。其中适用性、准确性、及时性、可取得性、可比性和可衔接性是国际统计界

7、公认的数据质量之基本构成要素和各国政府统计机构对数据进行质量检测、监管的重要内容和依据(余芳东,2002;Wang and Strong,1996;Naumann and Rolker,2000)。我们可将上述标准理解为统计数据质量的内涵。绝大部分文献,仍然以准确性评估为核心内容,因此统计数据质量存在问题一般都是指统计数据失准或失真。(一)统计数据失真机理统计部门的行为会直接影响数据质量,如统计数据搜集整理过程中出现的设计误差、调查误差、汇总误差等(王强,1990;颜德纶,1990)。统计主体间的博弈是产生数据质量问题的重要诱因,如企业和统计部门、上下级、区域间基于利益的博弈(朱秀君,2000

8、;卢冶飞,2003;朱文兴、张继良,2005);官员业绩博弈、干预基层博弈和干预统计博弈(林勇、杨言勇,2008);地方官员在经济竞争当中的政治晋升博弈(周黎安,2004)。同时,袁平德(2004)指出被统计部门(地方、企业)之间的博弈容易造成各种攀比现象,表现在总量上攀“块头”、均值上攀“高低”、纵比上攀“速度”、横比上攀“位次”、“唯上”中攀“宠幸”。对于统计体系,现行的国内生产总值(GDP)核算体系本身的缺陷则是文献所关注的重点。世界银行(1992)认为中国以样本为基础的生产指数和独立构造的价格平减指数欠缺,没有对未出售的库存进行冲销,导致了中国官方对GDP总量数据的低估和速度的高估;李

9、成瑞(1997)指出经济成份分类方面的科学性问题和所有制结构统计调查方面的准确性问题导致了含混或不准确和某些虚假不实现象的发生;孟连和王小鲁(2000)总结了七个导致数据偏差的可能机制。许宪春(2002)认为现行的GDP核算体系中,产业部门分类和支出项目分类仍然过粗,经常性的服务业统计调查制度欠缺,缺乏GDP的分季度生产核算和使用核算,价格指数资料存在缺口,未被观测的经济存在统计遗漏,统计系统的独立性不强,某些统计数据容易受到地方干扰;任若恩(2002)认为中国经济增长率被高估的主要原因是长期以来实行的可比价格法,考虑采用国际上通用的价格指数缩减法和生产指数法来测算经济增长率。岳希明(2005

10、)指出劳动统计方法的差异导致了就业人员总数、就业人员行业以及它们的时间变化方面较大的差异。宋小川(2007)通过讨论现行GDP核算体系的缺陷,认为中国GDP及其增长率被严重低估。同时统计管理体制、统计制度方法、统计基础工作、统计外部干扰等是影响政府统计数据质量的重要因素(政府统计数据质量研究课题组,1999)。肖宜滨(1999)在法学范畴内剖析了影响统计数据质量的原因,主要有行政自由裁量权对主体的干扰、部分统计工作者统计法制观念淡薄、请求权的非强制性。以上文献主要从统计部门、统计体系和统计外部体制环境三个方面分析了中国统计数据失真的原因。事实上,三个方面是相互影响的,尤其是外部体制环境对统计部

11、门的影响这一因素在中国尤为显著。很多时候,统计部门受到地方政府的干扰以及同级部门之间源于考核指标的竞争,而牺牲了统计数据的真实性。尤其是地方政府源于升迁和争取中央政策支持而产生的数据攀比和赶超,不能不引起公众对其所公布的统计数据真实性的怀疑。很多地区同年GDP增长率和该地区历年增长率惊人的相似以及和上级要求指标惊人的一致即为明证。很多文献也反复提及这一因素。理论上,统计体系本身的缺陷对数据质量的影响应该是系统性的,即在影响方向上应该是不变的。因此,导致目前统计数据存在问题的很大一部分原因可以归结为地方政府催生的统计部门间的博弈。基于对以上三个方面因素作用机理的理解,国内外学者主要从统计数据质量

12、控制、统计数据质量评估、统计数据质量管理三个方面出发,进行了大量的理论研究,给出了控制、评估和管理方法。(二)统计数据质量控制统计数据质量的控制,主要是数据搜集和整理过程中对误差的控制,针对统计误差所开展的理论研究,涉及测量误差的统计分布和检验、抽样误差以及非抽样误差、缺失数据的统计处理方法、汇总数据的误差等。基于这些研究,产生了抽样调查方法和非抽样误差控制技术(金勇进、陶然,2010)。Neyman(1934)关于分层抽样最优分配及回归、比率估计的研究是统计数据质量研究的一个重要里程碑。Hansen等(1961)提出了调查误差模型,该模型把总误差(均方误差)分解为测量误差、抽样误差、测量误差

13、与抽样离差的协方差以及偏差的平方四个组成部分,这一模型的建立为调查过程中误差的控制奠定了重要基础,随后的样本重复计量、交叉子样本等方法都是在此基础上发展而来。同一时期,Warner(1965)则对敏感性问题展开专项研究.提出了对敏感性问题调查的随机化方法。Dalenius(1983)认为数据质量的综合控制应包括调查设计控制和调查实施控制两部分,后者又分为预防控制和过程控制。Housman(2003)则将CPI偏差归结为四类:替代性偏差(substitutionbias)、新产品偏差(newgoodsbias)、质量改进偏差(qualitychangebias)、购买途径偏差(qutletbia

14、s)。Costa(2001)和Hamilton(2001)利用恩格尔曲线从总偏差的角度对CPI偏差进行了估计,依据恩格尔定理,他们认为家庭消费支出偏差可能源自对价格的错误估计。这一方法克服了传统方法只能估计单因素偏差的缺陷,同时数据要求较少,可操作性强。李成瑞(1984)从应用层面,将分阶段实施控制技术分别应用于我国第三次、第四次人口普查,取得了良好效果。傅德印(2000)系统讨论了政府统计数据控制技术,涉及调查变量和调查项目、调查误差类型以及建立和实施政府统计数据质量文档及监测等方面。杨清(2000)分析了系统性误差的特点和分解、产生原因和处理方法以及测定方法。同时,杨清和吴伟霞(2000)

15、指出运用方差分析、多重比较的q检验法(或HSD检验法)和交叉样本技术对原始资料的偏误进行监控。方差分析和多重比较检验二者相互补充,前者分析了控制变量是否对观测变量产生显著影响,后者则进一步确定控制变量的不同水平对观测变量的影响程度。在进行了交叉样本分析之后,进一步运用方差分析和多重比较,则可减弱或消除系统性误差的影响。(三)统计数据质量评估统计数据质量评估一方面可以检验所搜集到的数据本身的质量,另一方面还可以检验数据搜集过程中质量是否得到有效控制。刘孝新等(1997)运用事后预测和反常结果判断法对统计数据质量进行了评估和推断。成邦文和董丽娅(2002)从一致性误差和非一致性误差两个方面分析了社

16、会经济统计数据误差,关于前者的分析内容有趋势性分析、机构对比分析和相关指标关联分析,而对后者的分析则包括分布形态一致性检验和异常数据的识别。刘洪和黄燕(2007,2009)先后运用趋势模拟评估法和相关指标分析法,对统计数据质量进行了定量评估。张德然(2003)给出了根据各数据点的跳跃度所提供的信息来检验异常值的方法。而Rawski(2001)则认为由于现行的各类评估方法在逻辑思路和技术层面都有一定的局限性,因此在讨论中国统计数据质量时,应该更多关注整体经济数据的精确度、范围、覆盖面、统计方法以及其他技术问题。管于华和尚卫平(2003)根据CDDS国际标准对中国国民核算账户进行评估,从实际部门、财政部门、金融部门、对外部门和社会人口部门分别指出了中国统计数据的缺陷。常宁(2004)认为国际货币基金组织(IMF)的数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号