数据分析课程论文

上传人:工**** 文档编号:562115256 上传时间:2023-01-19 格式:DOCX 页数:6 大小:48.82KB
返回 下载 相关 举报
数据分析课程论文_第1页
第1页 / 共6页
数据分析课程论文_第2页
第2页 / 共6页
数据分析课程论文_第3页
第3页 / 共6页
数据分析课程论文_第4页
第4页 / 共6页
数据分析课程论文_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《数据分析课程论文》由会员分享,可在线阅读,更多相关《数据分析课程论文(6页珍藏版)》请在金锄头文库上搜索。

1、我国国内生产总值的影响因素分析内生产总值(GDP)指按市场价格计算的一个国家(或地区)所有常住单位在一 定时期内生产活动的最终成果。国内生产总值有三种表现形态,即价值形态、收 入形态和产品形态。在实际核算中,国内生产总值有三种计算方法,即生产法、 收入法和支出法。三种方法分别从不同的方面反映国内生产总值及其构成。从生 产总值的计算方法中可以反映出对GDP的影响因素有很多,在本文中我仅以其 中的一些因素与生产总值进行线性回归分析。以我国1978年一2008年间的数据为例,对我国国内生产总值的影响因素分 析,其中国内生产总值为因变量(Y),总人口数(XI)、能源生产总量(万吨标准 煤)(X2)、能

2、源消费总量(万吨标准煤)(X3)、国家财政支出(X4)、农林牧渔业总产值(X5)、 客运量总计(X6)、社会消费品零售总额(X7)、进出总额(X8)、金融机构现金投放(X9)为自变 量。(原始数据附件1的表一中)分析的目的: 我们希望通过线性回归分析得出线性回归的一般模型为:Y=B0+B1*X1+B2*X2+.+B9*X9(其中 B1,B2.B9 为未知参数); 我们希望根据表中所给的从1978-2010之间的的24个中国内生产总值数据 (其中2009年的为335353(亿元),2010年的为397983(亿元)推导出:以国内生产总值为因变量,时间(年)为自变量的函数:Y=F(t);,并以此方

3、程后预 测2011和2012年的国内生产总值; 分析的假设:以上问题的分析过程中不考虑当年通货膨胀因素对生产总值的影响; 以上问题只是进行定量的分析。分析一的过程:第一步:由于表中的数据属于时间序列数据,由于可能会存在自相关的问题导致F检 验和t检验失效,使得结构分析和预测时会带来较大的误差,所以首先将表一的数据进行差 分法处理。(处理结果为附件1的表二中)第二步:使用SPSS对表二的数据进行线性回归分析处理,选择菜单“ Analyze” - “Regreesion”f“linear”,回归选项卡中因变量选项框中为“内生产总值”,自变量框中 选入所有的自变量,变量的选择方法为“Enter”。得

4、到结果如下:Model SuoniyJodelE SquareAdjusted ESquareStd. Error of th已EstimateDurbin-Watson1.9921.984.9712.07017201543372E32.250ANOmeilodelSum of SquaresdfMean SquareFSig.1Regression2.964E993.293E876.244.0001Residual4.751E7114510302.251Total3.011E920Coefficients3ModelUnstandardized CoefficientsStandardize

5、d CoefficientstSig.BStd. ErrorBeta1(Constant)-550.4361 266.462-.435.672总人口数.455.444.0771.026.327能源生产总重吨标准煤)-.231.189-.173-1.224.247能源消费总里厉吨标准煤).053.257.041.208.839国家财政支出.925.080.2431.050.316农林牧迪业总产值1.017.445.2142.286.043客运重总计-.009.009-.097-.983.347社会消费品零售总额1.492.762.5271.957.076进出总额.414.196.3062.107

6、.059金融机枸现金投啟.028.96S.001.029.977a. Dependent Variable:国内生产总值从上面Model Summary表中可以看出R方的值为0.984 (接近1),说明方程的拟合效 果很好,其中的DW统计量为2.258,表明模型残差不存在序列自相关。(因为已经进行过 第一步处理)从ANOVA表中可以得出,总平方和的自由度为20,回归平方和的自由度为9,残差平 方和的自由度11,F统计量为76.244,显著性水平为0,说明方程非常显著,所有自变量作 为一个整体对因变量有显著影响。从Cofficients表中的显著性水平一列,可见大部分变量都不显著。说明模型存在多

7、重共 线性的问题。第三步:为了解决多重共线性的问题,我们采用逐步回归的方法进行变量选择。将 Method选项改为“逐步”重新输出的分析的结果为:Model summaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1,954a.909.9043.79379534E32,984b.968.9642.31436470E3ANOVACModelSum of SquaresdfMean SquareFSia.1Regression2.738E912.738E91 90.205,000aResidual2.735E8191.439E7

8、Total3.011E9202Regression2.91 5E921.457E9272.078,000bRe sidual9.641E7105356283.965Total3.011E920a. Predictors: (Constant),社合消费品零售总额b. Predictors: (Constant),社会消费品零售总额,进出总额c. Dependent Variable:国内生产总值Coefficierits3ModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant

9、)4117361294.917.318754社会消费品零售总额2.697.196.95413.791.0002(Constant)-311.054799.891-.389.702社会消费品零售总额2.119.156.74913.534.000进出总额.429.075.3175.749.000a. Dependent Variable:国内生产总值Excluded Variables0ModelBeta IntSig.Partial CorrelationCollinearity StatisticsTolerance1总人口數-,060a-.834.415-.193.932能源生产总重厉吨标准

10、煤),062a.696.495.162.622能源消费总里厉吨标准煤),148a1.877.077.405.674国家财政支出,296a1.190.249.270.076农林牧通业总产值,131a1.094.200.250.331客运里总计-,203a-3.034.007-.582.383进出总额.31 7a5749.000.805.585金融机构现金投啟-,021a-.292.774-.069.9862总人口數-,002b-.040.968-.010.881能源生产总重厉吨标准煤)-,077b-1.343.197-.310.510能源消费总重厉吨标准煤)-,069b-1.020.318-.2

11、42.390国家财政支出,036b.221.828.053.069农林牧迪业总产直,109b1.536.143.349.330客运重总计-,090b-1.100.207-.253.260金融机构现金投锁-,022b-.502.622-.121.986a. Predictors in the Model: (Constant),社合消费品零售总额b. Predictors in the Model: (Constant),社合消费品零售总额,进出总额c. Dependent Variable:国内生产总值从上面的表中我们可以看出,总人口数(XI)、能源生产总量(万吨标准煤)(X2)、 能源消费总

12、量(万吨标准煤)(X3)、国家财政支出(X4)、农林牧渔业总产值(X5)、客运量总计(X6)、金融机构现金投放(X9 )等自变量变得不再显著,综上所诉,我们选择的最终模型中, 社会消费品零售总额(X7)、进出总额(X8)为自变量。从表 conefficients表中可以得到参数B0=-311.54,B7=2.119,B8=0.429;结论一:最终可得线性回归方程为:Y= 331.54+2.119*X7+0.429*X8 (其中 X7, X8, Y 分别表示同一年的 社会消费品零售总额、进出总额和中国国内生产总值的增量)分析二的过程:第一步:将年份和所对应的国内生产总值数据导入到SPSS中,首先

13、作国内生产总值关 于时间t (年份)的散点图。结果如下图:wooooo300000.00-200000.00-100000.00-0.00=I1970I1980I1990VAR00001I2000I2010400000.00-第二步:从上图中我们可观测出时间与国内生产总值Y(t)不满足线性关系,所以我们选 择非线性回归分析。我们通过对散点图的进行多次不同模型的拟合,最终可以找到三次曲 线对散点图的拟合效果较好,拟合R平方=0.995,拟合结果如下:Model SummaryRR SquareAdjusted R SquareStd. Error of the Estimate.990.995.9958131.969ANOVASum of SquaresdfMean SquareFSia.Regression2.784E1139.231E101403.474.000Re sidual1.323E9206.61 3E7Total2.798E1123CoefficientsUnstandardizEd CoEfficiEntsStandardized CciEfficiEntstSig.BStd. ErrorBetaCase Sequence1 7574.S04

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号