那曲地区“十县一区”经济发展综合分析—基于 SAS 统计软件的经济发展综合评估双湖特别区统计局康宏二零一零年十月关于那曲地区十县一区经济发展的综合分析 双湖区统计局- 1 -那曲地区“十县一区”经济发展综合分析—基于 SAS 统计软件的经济发展综合评估2010 年是“十一五”规划的收官之年,衔接“十二五”规划的关键之年,也是全面贯彻落实中央第五次西藏工作座谈会和区党委工作会议精神的第一年;准确分析我地“十县一区”国民经济发展状况,为今后一个时期各县区经济工作的开展与决策建言献策是本文研究的最终目的联合国大会第 64/267 号决议决定将 2010 年的 10 月 20 日定为“世界统计日”,为贯彻自治区统计局、调查总队《关于认真开展庆祝“中国统计开放日”和“世界统计日”活动的通知》(藏统字【2010】117 号)的文件精神,庆祝统计人自己的节日,特做此次经济发展综合统计分析, 本文将利用专业的统计分析软件 SAS 等对“十县一区”主要经济指标进行综合分析,确定和解释影响我地经济发展状况的主要因素,并就我地经济发展中存在的矛盾与问题进行全面的解析。
一、关于“十县一区”经济发展的综合分析1、主成分分析和指标选择主成分分析法是将多个指标化为少数几个不相关的综合指标的多元统计分析方法,其基本原理是通过数学变换在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理,把众多可能相互包含重复信息的指标转化成新的相互独立的综合指标,并选取在变差总信息量中比例较大的少数几个综合指标来替代原来众多的指标,关于那曲地区十县一区经济发展的综合分析 双湖区统计局- 2 -对分析对象进行相应的分析、评价,这些新的综合指标并没有具体的指代,而是对原有相关指标信息的综合经济发展的评价是多方面的,选用的指标也是不同的,本文采用了常用的 9 个经济指标,这 9 个指标是从不同角度对经济发展状况的评价指标体系建立如下序号 指标名称X1 地区生产总值(万元)X2 人均地区生产总值(万元)X3 第一产业增加值(万元)X4 第二产业增加值(万元)X5 第三产业增加值(万元)X6 财政总收入(万元)X7 各项税收(万元)X8 社会消费品零售总额(万元)X9 农村居民人均纯收入(元)2、主成分分析及综合评价模型本文主要利用 SAS 软件中的主成分分析方法 , 根据那曲地区“十县一区”2009 年年度统计数据,对以上指标体系中的指标进行主成分分析,从中提取出几个主要的、相互独立的综合指标来代替原来的指标对各县区经济发展水平进行综合统计评价。
关于那曲地区十县一区经济发展的综合分析 双湖区统计局- 3 -那曲地区“十县一区”2009 年年经济指标县名 GDP 人均GDP一产增加值二产增加值三产增加值财政总收入各项税收消费品零售总额农牧民人均纯收入那曲县 57386 0.77 16681 13154 27551 22822 1290 18206 3936嘉黎县 26475 0.86 5592 8754 12129 14431 1328 7541 4557比如县 42148 0.69 13683 11222 1724 16430 365 6894 4795聂荣县 27413 0.88 5568 9430 12418 13168 273 2802 2938安多县 35945 0.98 7136 9323 19487 13857 348 5884 3944申扎县 22118 1.13 4080 4653 13385 9182 195 2884 2879索县 27600 0.64 7376 6638 13587 13419 337 7947 3031班戈县 30189 0.81 9811 7992 12387 12644 283 5439 3187巴青县 37120 0.83 9835 7905 19380 15252 386 9363 3812尼玛县 29908 1.09 7079 5285 17543 8635 247 5893 3621双湖区 16278 1.31 4453 2852 8973 4770 874 4053 4560资料来源:《各县区社会经济基本情况调查表》3、各项经济指标之间的相关性分析指标选取之后,运用 SAS 软件对该指标体系进行相关性分析。
部分指标之间相关性高,会使依据此指标体系而得出的统计数据所反映的信息在一定程度上有所重叠,从而在利用相关统计方法研究此指标体系时,增加计算量,使研究、分析问题的过程更加复杂各项经济指标的相关矩阵The PRINCOMP ProcedureCorrelation MatrixCorrelationsNO x1 x2 x3 x4 x5x1 1.00000 -0.58453 0.93249 0.86627 0.50525x2 -0.58453 1.00000 -0.62166 -0.72295 -0.02465x3 0.93249 -0.62166 1.00000 0.78180 0.28506x4 0.86627 -0.72295 0.78180 1.00000 0.26742x5 0.50525 -0.02465 0.28506 0.26742 1.00000x6 0.90604 -0.77839 0.82287 0.94185 0.43016x7 0.27458 -0.01600 0.25691 0.30281 0.26483x8 0.84502 -0.47837 0.80778 0.64028 0.64322x9 0.21096 0.06936 0.28094 0.20063 -0.26152关于那曲地区十县一区经济发展的综合分析 双湖区统计局- 4 -CorrelationsNO x6 x7 x8 x9x1 0.90604 0.27458 0.84502 0.21096x2 -0.77839 -0.01600 -0.47837 0.06936x3 0.82287 0.25691 0.80778 0.28094x4 0.94185 0.30281 0.64028 0.20063x5 0.43016 0.26483 0.64322 -0.26152x6 1.00000 0.36663 0.80690 0.12001x7 0.36663 1.00000 0.60368 0.57363x8 0.80690 0.60368 1.00000 0.24904x9 0.12001 0.57363 0.24904 1.00000从以上相关矩阵可以看出,不少指标之间都是相互关联的,而且部分指标之间的相关系数相对很高,例如 X1 与 X3 之间的相关系数为 0.93,X1 与 X6 上之间的相关系数为 0.81,X3 与 X6 之间的相关系数为 0.82,(相关系数的取值范围(0~±1),越接近+1,表示正相关性越好;越接近-1,表示负相关性越好;越接近 0,表示相关性越差)主成分分析就是消除信息叠加,提取出相互独立的综合指标,来取代这些彼此之间相关性较高的指标,从而更简单、明了地综合评估“十县一区”的经济发展规模与状况。
4、因子分析的过程与主要输出结果1)、方差贡献率 The FACTOR ProcedureInitial Factor Method: Principal ComponentsPrior Communality Estimates: ONEEigenvalues of the Correlation Matrix: Total = 9 Average = 1NO Eigenvalue Difference Proportion Cumulative1 5.27614842 3.71659871 0.5862 0.58622 1.55954971 0.30831599 0.1733 0.75953 1.25123372 0.76282894 0.1390 0.89854 0.48840478 0.21995263 0.0543 0.95285 0.26845215 0.13997999 0.0298 0.98266 0.12847217 0.10832961 0.0143 0.9969关于那曲地区十县一区经济发展的综合分析 双湖区统计局- 5 -7 0.02014256 0.01356686 0.0022 0.99928 0.00657570 0.00555491 0.0007 0.99999 0.00102079 0.0001 1.00003 factors will be retained by the NFACTOR criterion.从上面SAS运行的结果可以看出前3个因素的累积贡献率达到了89.85%。
方差贡献率越大说明该指标所包含的综合信息越多,即表明这前3个因素对我地“十县一区”经济发展状况的解释能力已经达到了89.85%也就是说前两个主要因子已经基本反映了原始变量所含所有信息的89.85%在SAS默认的抽取因素的条件下,抽取了前3个因素, 这前3个因素基本反映了问题的主要方面, 它们的累积贡献率达到了89.85%2)、因子分析的载荷矩阵Factor PatternNO Fac。