应用回归分析结课论文

上传人:第*** 文档编号:55939469 上传时间:2018-10-08 格式:DOC 页数:28 大小:644KB
返回 下载 相关 举报
应用回归分析结课论文_第1页
第1页 / 共28页
应用回归分析结课论文_第2页
第2页 / 共28页
应用回归分析结课论文_第3页
第3页 / 共28页
应用回归分析结课论文_第4页
第4页 / 共28页
应用回归分析结课论文_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《应用回归分析结课论文》由会员分享,可在线阅读,更多相关《应用回归分析结课论文(28页珍藏版)》请在金锄头文库上搜索。

1、应用回归分析结课论文应用回归分析结课论文影响财政收入的相关因素的分析影响财政收入的相关因素的分析班级:班级: 姓名:姓名: 学号:学号:目目 录录1.问题的提出 4 2.数据来源 4 3.回归分析的模型方法介绍和总结 5 3.1 多元线性回归模型 .5 3.1.1 多元线性回归模型的一般形式5 3.1.2 多元线性回归模型的基本假定6 3.2.多元线性回归参数的最小二乘估计.7 4.SAS 程序及结果输出.8 4.1.建立数据集,进行相关分析.8 4.2.将数据做标准化处理,建立回归方程10 4.3.异方差检验11 4.4 自相关检验 13 4.5. 多重共线性检验.14 4.5.1 方差扩大

2、因子法.14 4.5.2 特征根判定法.14 4.6 消除多重共线性 15 4.6.1 后退法.15 4.6.2.逐步回归 19 4.7 最佳子集回归 22 4.8 岭回归 22 4.9 主成分回归 25 4.10 偏最小二乘回归 .26 5.结论 .27 参考文献 .28摘要本文选1985-2003 年的农业增加值,工业增加值,建筑业增加值,社会消费总额,人口数,受灾面积六个因素通过多元线性回归分析和岭回归对国家财政收入行分析,主要分析分析影响财政收入的主要原因,并联系实际进行分析,以供参考。关键词:财政收入 多元线性回归 多重共线性 岭回归1.问题的提出问题的提出财政参与分配社会产品,在一

3、国经济发展和分配体系中占有重要地位和作用。可 以有力地促进经济的发展促进科学、教育、文化、卫生事业的发展,促进人民生活水 平的提高,为巩固国防提供可靠的物质保障。且可调节资源配置,促进社会公平,改 善人民生活。促进经济机构的优化和经济发展方式的转变。 在我国,财政收入的主体是税收收入,因此在税收体制及政策不变的条件下, 财政收入会随着经济繁荣而增加,随着经济衰退而下降。本文利用回归分析,确定影 响我国财政收入主要因素。2.数据来源数据来源在研究国家收入时,我们把财政收入按形式分为:各项税收收入,企业收入,债 务收入,国家能源交通重点建设基金收入,基本建设贷款归还收入,国家调节基金收 入,其他收

4、入等。 为了建立国家财政收入回归模型,我们以财政收入 y(亿元)为因变量,自变量如下: x1 为农业增加值(亿元);x2 为工业增加值(亿元);x3 为建筑业增加值(亿元);x4 为 人口数(万人);X5 为社会消费总额(亿元);x6 为 受灾面积(万公顷)。根据中国统计 年鉴,得到 1985-2003 年数据,如图:3.回归分析的模型方法介绍和总结回归分析的模型方法介绍和总结3.1 多元线性回归模型多元线性回归模型3.1.1 多元线性回归模型的一般形式多元线性回归模型的一般形式设随机变量与一般变量, ,的线性回归模型为:y1x2xpx(3.1)ppxxxy2211式中,是个未知参数,称为回归

5、常数,称为回归01p1p01p系数。称为被解释变量(因变量) ,是个可以精确测量并控制的一般变ypxxx, 21p量。称为解释变量(自变量) 。时,式(3.1)为一元线性回归模型;时,我1p2p们就称式(3.1)为多元线性回归模型。是随机误差,与一元线性回归一样,对随机误差项我们常假定(3.2)0)(2var)(称(3.3) ppxxxy22110为理论回归方程。对一个实际问题,如果我们获得组观测数,则线性nniyxxxiipii, 2 , 1;,21回归模型式(3.1)可表示为:1112211101ppxxxy(3.4)2222221102ppxxxynnppnnnxxxy22110写成矩阵

6、形式为:(3.5) Xy是一个阶矩阵,称为回归设计矩阵或资料矩阵。在实验设计中,X1 pn的元素是预先设定并可以控制的,人的主观因素可作用其中,因而称为设计矩XX阵。3.1.2 多元线性回归模型的基本假定多元线性回归模型的基本假定为了方便地进行模型的参数估计,对回归方程式(3.4)有如下一些基本假定(1)解释变量, ,是确定性变量,不是随机变量,且要求1x2xpx。这里的,表明设计矩阵中的自变量列之间不 npX1rank npX1rankX相关,样本量的个数应大于解释变量的个数,是一满秩矩阵。X(2)随机误差性具有零均值和等方差,即 0i,2ji ji,covnji, 2 , 1,,0ji 这

7、个假定通常称为高斯马尔柯夫条件。,即假设观测值没有系统误差, 0i随机误差项的平均值为零,随机误差项的协方差为零,表明随机误差项在不同的ii样本点之间是不相关的(在正态假定下即为独立的) ,不存在序列相关,并且有相同的精度。(3)正态分布的假定条件为:2, 0Ni相互独立n,21对于多元线性回归的矩阵模型式(3.5) ,这个条件便可表示为:nN2, 0由上述假定和多元正态分布的性质可知,随机变量服从维正态分布,回归模yn型式(3.5)的期望向量 XyE ny2var因此),(2 nXNy3.2.多元线性回归参数的最小二乘估计多元线性回归参数的最小二乘估计多元线性回归模型未知参数,的估计与一元线

8、性回归方程的参数估计原01p理一样,仍可采用最小二乘估计。对于,所谓最小二乘法,就是寻找参数 Xy,的估计值,使离差平方和 Q(,)极小,即:01p01p4.SAS 程序及结果输出程序及结果输出4.1.建立数据集,进行相关分析建立数据集,进行相关分析程序 1 data a;input year y x1-x6;cards;19852004.823619.5 9716675.11058.513801.4 443.6519862122.01401311194808.07 1075.074374471.419872199.354675.7 13813954.65 10935115420.919882

9、357.245865.3 182251131.651110.266534.6 508.719892664.9 6534.7 220171282.981127.047074.2 469.9119902937.1 7662.1 239241345.011143.337250.3 384.7419913149.488157266251564.331158.238245.7 554.7219923483.379084.7 345992174.441171.719704.8 513.3319934348.9510995.5484023253.5 1185.1712462.1488.2919945218.

10、1 15750.5701764653.321198.5 16264.7550.4319956242.2 20340.9918945793.751267.4320620546.8819967407.9922353.7995958282.251211.2124774.1458.2119978651.1423788.4113733 9126.481223.8927298.9469.8919989875.9524542.9119048 10061.991276.2729152.5521.55199911444.0824519.1126111 11152.861236.2631134.7534.2920

11、0013395.2324915.885673.712497.61284.53334152.6471.19200116386.0426179.69548.9815361.561247.6137595.2501.45200218903.6427390.811076.518527.181257.8642027.1499.81200321715.2529691.814771.223083.871292.2745842545.06;run;proc print;run;proc corr data=a noprob;var y x1-x6;run;结果一一一分析:从相关阵看出,y 与 x2 的相关系数偏

12、小,x2 是工业增加值,这说明工业增加值对财政收入无显著影响。4.2.将数据做标准化处理,建立回归方程将数据做标准化处理,建立回归方程程序 2: proc standard data=a mean=0 std=1 out=out1;var y x1-x6;run;proc print data=out1;run;proc reg data=out1;model y=x1-x6;run; 结果:一一因为数据为标准化数据,所以方程中不含有常数项。所以有回归方程为一Y=0.117.8x1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由决定系数 R

13、方=0.9957,调整 R 方=0.9936,得回归方程高度显著。又有 F=463.63,P F F模型模型6 674884516 112480753 463.63 F FInterceptIntercept -733.03047 5750.12654 3942.677580.020.9007x1x10.076530.101541378050.570.4656x2x2-0.016860.0070214010785.780.0333x3x30.797380.1007815185876 62.59 F Fx5x50.003910.001989449613.900.0719x6x61.353713.

14、25216420350.170.6846条件数字的边界: 67.419, 755.1向后消除: 第 1 步变量 x4 已删除: R 方 = 0.9957 和 C(p) = 5.0529方差分析方差分析源源自由度自由度平方平方 和和均方均方F F 值值PrPr F F模型模型5 674871688 134974338 600.07 F FInterceptIntercept 553.06322 1285.69944416220.190.6741x1x10.091750.074123447241.530.2376x2x2-0.017240.0065715516386.900.0209x3x30.7

15、89040.0905517079718 75.93 F F模型模型4 674780920 168695230 783.36 F FInterceptIntercept 1343.77319 315.048523917760 18.190.0008x1x10.095490.072293757341.740.2077x2x2-0.017100.0064215269657.090.0186x3x30.789280.0886017090279 79.36 F F模型模型3 674405186 224801729 994.52 F FInterceptIntercept 1674.73790 195.668761655910073.26 F F1 1 x45 0.0000 0.9957 5.0529 0.050.8220“向后消除向后消除”的汇总的汇总步步 删除的删除的 变量变量引入引入 变量数变量数偏偏 R R 方方模型模型 R R 方方C(p)C(p)F F 值值PrPr F F2 2 x64 0.0001 0.9956 3.4270 0.400.53633 3 x13 0.0006 0.9950 2.9758 1.740.2077 表 8 参数都具有显著性意义,最优

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号