基于逐步回归分析法的国家财政收入模型分析

上传人:飞*** 文档编号:30657786 上传时间:2018-01-31 格式:DOCX 页数:18 大小:1,012.78KB
返回 下载 相关 举报
基于逐步回归分析法的国家财政收入模型分析_第1页
第1页 / 共18页
基于逐步回归分析法的国家财政收入模型分析_第2页
第2页 / 共18页
基于逐步回归分析法的国家财政收入模型分析_第3页
第3页 / 共18页
基于逐步回归分析法的国家财政收入模型分析_第4页
第4页 / 共18页
基于逐步回归分析法的国家财政收入模型分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《基于逐步回归分析法的国家财政收入模型分析》由会员分享,可在线阅读,更多相关《基于逐步回归分析法的国家财政收入模型分析(18页珍藏版)》请在金锄头文库上搜索。

1、 应用数理统计 中期第一次作业 第 1 页 共 18 页基于逐步回归分析法的国家财政收入模型分析SY1107409 胡亮(北京航空航天大学机械工程及自动化学院工业与制造系统工程系,北京,100191)【摘要】中国国家财政收入与农业总产值、工业总产值、建筑业总产值、服务业总产值、全国人口总量、成灾面积六个变量有关。本文利用SPSS Statistics对数据对国家财政收入y 与其相关因素进行回归分析。发现六个变量之间存在较强的多重共线性,继而利用逐步回归法对模型进行修改。结果表明,国家财政收入受服务业总产值和全国总人口影响最大。【关键词】财政收入;多重线性;逐步回归法。一 引言逐步回归理论简介在

2、经济模型的建立中,由于经济指标较之一般指标更为综合,包含信息交性强,指标间多重共线性现象在经济模型建立过程中不可避免。多重共线性的存在,一方面使得入选的经济指标作为其他指标的综合反映,无法独立反映与经济总量之间的结构因果关系;另一方面,多重共线性使得统计检验失效,回归模型缺乏稳定性,可靠程度低。因而在进行经济模型建立时,必须充分考虑经济指标变量间的多重共线性问题,保证变量间的相互独立。最常用于克服模型变量的多重共线性问题有三类方法:排除引起共线性的变量;差分法;减小参数估计量的方差。后两类方法都只能减轻多重共线性对模型的影响,而第一类方法,从根本上寻找引起多重共线性的解释变量,将其排除出原模型

3、,因而更为有效。本文将该原理的应用逐步回归方法引入财政收入模型的建立问题中。在应用回归分析去处理实际问题时一个关键问题就是如何选择回归自变量。一般情况下,人们罗列出来可能与因变量有关的自变量往往很多,其中有一些 应用数理统计 中期第一次作业 第 2 页 共 18 页变量对因变量可能没有影响或影响很小。如果在建立回归模型时将这样一些变量都包含进来,不但计算量大,而且估计和预测的精度也会下降。而且某些情况下,许多自变量的观测数据的获得代价较大,如果这些自变量被错误地选进模型,也会引起经济成本的升高。另外,自变量太多,往往存在共线性。正是由于这些原因,在应用回归分析中对进入模型的自变量作精心选择是十

4、分必要的。目前利用逐步回归分析方法即利用自变量和因变量的一系列同步观测数据,通过对相关矩阵的变换和数理统计的假设检验,逐步将显著性的自变量选入回归方程中,同时每引入一个新变量后又要对老变量逐个检查,将变得不显著性的自变量从回归方程中剔除,重复步骤,直到所有模型外的变量都不能引入,模型内的变量都不能被剔除为止,最终建立一个最优回归方程。二 问题的提出在回归分析中,对自变量的选择很重要。逐步回归法能使回归式保留几个最为显著的自变量。我们以财政收入 (亿元)为因变量,选择的自变量如下:Y为农业总产值(亿元); 为工业总产值(亿元); 为建筑业总产值1X2X3X(亿元); 为服务业总产值(亿元); 为

5、全国人口总量(万人); 为4 5 6X成灾面积(万公顷)(据2011年中国统计年鉴获得各年份的统计数据)。如表1所示,选取1978年、1980年、1985年、1990年至2009年13年的相关统计数据建立回归模型。表 2.1 数据统计年份 农业总产值工业总产值建筑业总产值服务业总产值全国人口总量(万人)成灾面积(千公顷) 财政收入1978 1117.5 1607.0 138.2 872.5 96259 24457 1132.261980 1454.1 1996.5 195.5 982.0 98705 29777 1159.931985 2506.4 3448.7 417.9 2585.0 10

6、5851 22705 2004.82 应用数理统计 中期第一次作业 第 3 页 共 18 页1990 4954.3 6858.0 859.4 5888.4 114333 17819 2937.101991 5146.4 8087.1 1015.1 7337.1 115823 27814 3149.481992 5588.0 10284.5 1415.0 9357.4 117171 25893 3483.371993 6605.1 14188.0 2266.5 11915.7 118517 23134 4348.951994 9169.2 19480.7 2964.7 16179.8 11985

7、0 31382 5218.101995 11884.6 24950.6 3728.8 19978.5 121121 22268 6242.201996 13539.8 29447.6 4387.4 23326.2 122389 21234 7407.991997 13852.5 32921.4 4621.6 26988.1 123626 30307 8651.141998 14241.9 34018.4 4985.8 30580.5 124761 25181 9875.951999 14106.2 35861.5 5172.1 33873.4 125786 26734 11444.082000

8、 13873.6 40033.6 5522.3 38714.0 126743 34374 13395.232001 14462.8 43580.6 5931.7 44361.6 127627 31793 16386.042002 14931.5 47431.3 6465.5 49898.9 128453 27160 18903.642003 14870.1 54945.5 7490.8 56004.7 129227 32516 21715.252004 18138.4 65210.0 8694.3 64561.3 129988 16297 26396.472005 19613.4 77230.

9、8 10367.3 74919.3 130756 19966 31649.292006 21522.3 91310.9 12408.6 88554.9 131448 24632 38760.202007 24658.1 110534.9 15296.5 111351.9 132129 25064 51321.782008 28044.2 130260.2 18743.2 131340.0 132802 22283 61330.352009 30611.1 135239.9 22398.8 147642.1 133474 21234 68518.30表 2.2 描述统计量N 极小值 极大值 均值

10、 标准差农业总产值 23 1117.5 30611.1 13256.144 8119.4032工业总产值 23 1607.0 135239.9 44301.211 40167.4884建筑业总产值 23 138.2 22398.8 6325.515 5997.7578服务业总产值 23 872.5 147642.1 43357.103 42249.2402全国人口总量(万人) 23 96259 133474 122036.48 10351.229 应用数理统计 中期第一次作业 第 4 页 共 18 页成灾面积(千公顷) 23 16297.31650000000034374.0000000000

11、0025392.414630434780004767.928352014070000财 政 收 入 23 1132.26 68518.30 18062.2574 19707.80863在解释变量与被解释变量之间一一建立散点图: 应用数理统计 中期第一次作业 第 5 页 共 18 页 应用数理统计 中期第一次作业 第 6 页 共 18 页 应用数理统计 中期第一次作业 第 7 页 共 18 页由散点图可以看出因变量Y(财政收入)与自变量X1(农业总产值),X2(工业总产值),X3(建筑业总产值),X4(服务业总产值)、X5(成灾面积)之间基本存在着线性关系,初步估计建立的是线性模型。三 模型的建

12、立根据题目要求,建立的线性回归分析模型如下: nXbXbaYL321其中, 为因变量的预测值或估计值。 , , ,, 为自变量。 和123 a, , , 为回归系数。为了使以上线性回归分析方法达到最优,就要要1b23nb求自变量 , , ,, 首先满足以下两个条件:1X23nX(1)在线性回归分析模型中, 要包含所有对 影响显著的自变量, 消除对Y影响不显著的自变量;Y(2)模型包含的各自变量之间不存在多重共线性即各自变量之间不存在线性 应用数理统计 中期第一次作业 第 8 页 共 18 页关系或近似线性关系。表3.1 描述统计量N 极小值 极大值 均值 标准差农业总产值 23 1117.5

13、30611.1 13256.144 8119.4032工业总产值 23 1607.0 135239.9 44301.211 40167.4884建筑业总产值 23 138.2 22398.8 6325.515 5997.7578服务业总产值 23 872.5 147642.1 43357.103 42249.2402全国人口总量(万人) 23 96259 133474 122036.48 10351.229成灾面积(千公顷) 23 16297.31650000000034374.00000000000025392.414630434780004767.928352014070000财 政 收

14、入 23 1132.26 68518.30 18062.2574 19707.80863首先本文利用社会统计学软件SPSSl3.0,对所有因素进行相关分析,采用Pearson相关系数,输出结果如下:表3.2 相关性财 政 收 入 农业总产值 工业总产值 建筑业总产值财 政 收 入 1.000 .929 .989 .991农业总产值 .929 1.000 .968 .962工业总产值 .989 .968 1.000 .993建筑业总产值 .991 .962 .993 1.000服务业总产值 .995 .958 .997 .996全国人口总量(万人) .702 .882 .779 .756Pear

15、son 相关性成灾面积(千公顷) -.246 -.181 -.217 -.225财 政 收 入 . .000 .000 .000农业总产值 .000 . .000 .000工业总产值 .000 .000 . .000建筑业总产值 .000 .000 .000 .Sig. (单侧)服务业总产值 .000 .000 .000 .000 应用数理统计 中期第一次作业 第 9 页 共 18 页全国人口总量(万人) .000 .000 .000 .000成灾面积(千公顷) .129 .205 .160 .152财 政 收 入 23 23 23 23农业总产值 23 23 23 23工业总产值 23 23 23 23建筑业总产值 23 23 23 23服务业总产值 23 23 23 23全国人口总量(万人) 23 23 23 23N成灾面积(千公顷) 23 23 23 23服务业总产值全国人口总量(万人)成灾面积(千公顷)财 政 收 入

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号