应用数理统计课外大作业范例

上传人:cn****1 文档编号:490167727 上传时间:2023-03-03 格式:DOC 页数:6 大小:515.51KB
返回 下载 相关 举报
应用数理统计课外大作业范例_第1页
第1页 / 共6页
应用数理统计课外大作业范例_第2页
第2页 / 共6页
应用数理统计课外大作业范例_第3页
第3页 / 共6页
应用数理统计课外大作业范例_第4页
第4页 / 共6页
应用数理统计课外大作业范例_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《应用数理统计课外大作业范例》由会员分享,可在线阅读,更多相关《应用数理统计课外大作业范例(6页珍藏版)》请在金锄头文库上搜索。

1、数理统计案例分析大作业(范例)学号 姓名 专业 成绩 国家财政收入的多元线性回归模型摘要:用Excel求解与之间的初步回归模型,得到初步回归直线方程 然后对此方程进行线性显著性检验和回归系数显著性检验。由知与之间存在显著的线性,然而只有自变量满足通过值检验,从而回归系数与之间没有显著的线性关系,说明自变量之间存在多重共线性关系。采用MATLAB逐步回归方法对数据进行处理,根据程序自动提示得到最优回归方程,此时,。最后采用2010年的数据对此方程进行验证,得到结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。一、问题提出近年来,随着国家经济水平的飞速发展,人民生活水平日益提高

2、,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资

3、总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,社会商品零售总额,人口总数等。二、数据描述从中国统计年鉴2010查选数据,整理如表2-1所示:表2-1.1990-2009年财政收入及其影响因素统计表工业(亿元)农业(亿元)受灾面积(千公顷)建筑业(亿元)人口(万人)社会商品零售总额(亿元)国民生产总值(亿元)财政收入(亿元)199018689.227662.13847413451143338300.118718.32937.1199122088.68815

4、7554721564.31158239415.621826.23149.48199227724.219084.7513332174.411717110993.726937.33483.3719933969310995.5488293253.511851714270.435260.04348.95199451353.0315750.5550434653.311985018622.948108.55218.1199554946.8620340.9458215793.812112123613.859810.56242.2199662740.1622353.7469898282.21223892836

5、0.270142.57407.99199768352.6823788.4534299126.512362631252.978060.88651.14199867737.1424541.9501451006212476133378.183024.39875.95199972707.0424519.14998111152.912578635647.988479.211444.08200085673.6624915.85468812497.612674339105.798000.513395.23200195448.9826179.65221515361.512762743055.4108068.2

6、16386.042002110776.4827390.847119.118527.112845348135.9119095.718903.642003142271.2229691.854506.323083.812922752516.3135174.021715.252004201722.193623937106.25627745.312998859501159586.726396.472005251619.539450.938818.22534552.013075667176.6185808.631649.292006316588.9640810.841091.4141557.1131448

7、76410217522.738760.22007405177.1348892.935972.2351043.713212989210267763.751321.782008130260.233702.056234.2618743.2132802116032316228.861330.352009135239.935226.050223.5122398.813347414894343464.768518.30变量的假设如下表所示:表2-2.自变量假设表项目工业(亿元)农业(亿元)受灾面积(千公顷)建筑业(亿元)人口(万人)社会商品零售总额(亿元)国民生产总值(亿元)财政收入(亿元)变量 三、模型

8、建立(1)回归模型的建立:多元回归模型 写成矩阵形式即为:,其中当残差最小时,回归系数的解为(2)对回归分析进行参数检验线性回归模型的显著性检验提出假设采用R检验法,为样本的多元相关系数,R越接近1表示与之间的线性相关越密切;越接近0表示与之间的线性相关越不显著。对给定的显著水平,当的样本值时(其中为年份总数20,为前系数个数7),认为与之间的线性相关显著;否则认为与之间的线性相关不显著。回归系数的显著性检验提出假设,其拒绝域为设,有 有而且与独立,当成立时有。对于给定显著性水平,拒绝与的临界值为。如果结果是拒绝,即为,表示与之间存在显著的线性关系;如果接受,即为,则应将从回归方程中剔除,建立

9、新的回归方程,重新用最小二乘法估计回归参数系数。一般而言,但有如下关系:。剔除不显著的自变量的时候,考虑到自变量之间的交互作用对的影响,每次只剔除一个自变量,如果有几个自变量检验都不显著,则先剔除的样本值中的最小的那个自变量。当剔除,重新建立新的回归方程后,还必须对剩下的变量再逐一检验它们的显著性,直至保留下的自变量对Y都有显著的作用为止。(4)MATLAB对模型的逐步回归分析采用MATLAB调用stepwise命令,用逐步回归分析工具箱,根据程序来选择最优变量组合,获得最优回归直线方程。四、计算方法设计和计算机实现采用Excel初步计算回归直线参数,检验线性回归模型的显著性,再检验回归系数的

10、显著性。如果存在部分系数没有通过显著性检验,则采用逐步回归方法对与进行处理。逐步回归可以借助MATLAB的命令工具箱stepwise进行。五、主要的结论(1)采用Excel计算回归直线方程结果图5.1与之间变化关系用Excel求解与之间的回归方程,其结果如下所示:表5.1回归统计Multiple R0.999698R Square0.999396Adjusted R Square0.999044标准误差617.9686观测值20表5.2方差分析DFSSMSFSignificance F回归分析77.59E+091.08E+092837.6382.41E-18残差124582622381885.

11、2总计197.59E+09表5.3方差分析Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept2848723619.411.2060840.251027-22975.379949.27-22975.379949.27X Variable 1-0.009090.021538-0.421920.68054-0.056010.037839-0.056010.037839X Variable 2-0.462080.100447-4.600190.000611-0.68093-0.24322-0.68093-0.

12、24322X Variable 3-0.031870.036786-0.866320.403303-0.112020.048281-0.112020.048281X Variable 40.2860660.1664761.7183650.111398-0.076650.648785-0.076650.648785X Variable 5-0.221980.215922-1.028050.324205-0.692430.248476-0.692430.248476X Variable 6-0.002920.009354-0.311860.760501-0.02330.017464-0.02330

13、.017464X Variable 70.2399630.0035767.216667.8E-170.2321850.2477420.2321850.247742从而回归直线方程为:其中回归方程的相关系数较大,且显著性水平接近0,故认为财政收入与上述变量之间存在显著的线性关系。但是只有变量满足通过t值检验,从而可以认为自变量之间存在较强的多重共线性。(2)采用MATLAB计算回归直线方程结果下面采用MATLAB的stepwise工具箱进行多元线性分析:图5.2stepwise计算逐步回归根据软件自带的提示,在RMSE最小的时候最大,同时p满足要求。此时,。故选择变量,最优回归直线方程为:六、结果分析与检验对得到的最优回归模型做检验,置信度为95%,由上述表格知2010年的人口数为133474(亿元),国内生产总值为343464.7(亿元),Y财政收入为68518.3(亿元),将自变量带入回归方程(亿元)预测区间为, 其中(亿元)代入数值得到置信度为95%的预测区间为,与2010年财政收入68518.30(亿元)比较接近。综合来看,此数据模型基本达到了预期的目的。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号