多元线性回归—国内旅游收入因素研究分析

上传人:平*** 文档编号:14012040 上传时间:2017-10-27 格式:DOC 页数:9 大小:390.08KB
返回 下载 相关 举报
多元线性回归—国内旅游收入因素研究分析_第1页
第1页 / 共9页
多元线性回归—国内旅游收入因素研究分析_第2页
第2页 / 共9页
多元线性回归—国内旅游收入因素研究分析_第3页
第3页 / 共9页
多元线性回归—国内旅游收入因素研究分析_第4页
第4页 / 共9页
多元线性回归—国内旅游收入因素研究分析_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《多元线性回归—国内旅游收入因素研究分析》由会员分享,可在线阅读,更多相关《多元线性回归—国内旅游收入因素研究分析(9页珍藏版)》请在金锄头文库上搜索。

1、统计学课程案例研究题 目: 国内旅游收入因素研究分析 学 院: 经济管理学院 指导教师: 王秀芝 团队成员: 卢盈(11097111) 欧阳园园(11096103) 黄升(11096119) 范哲武(11096118) 陈光星(11096117) 二 O 一四 年 五 月 南昌航空大学统计学课程案例研究 - 1 -1. 多元线性回归的概念及主要内容框架1.1 多元线性回归的概念多元线性回归模型是用两个或两个以上的解释变量来解释因变量的一种模型。设为 因变量, 为 k 个用来说明 的被称为解释变量的不同YX,21, Y变量,其中 恒等于 1,则 (1)1X ),2(,21 niXYkiii 式称

2、为多元线性回归模型。其中, 为随即扰动项;参数),(ni称为回归系数。若令k,21, nkknnkn XXY 212121212121 ,则(1)式可用矩阵形式表示为: 式。Y1.2 多元线性回归的主要内容框架南昌航空大学统计学课程案例研究 - 2 -2. 多元线性回归模型的检验2.1 拟合优度的检验回归方程的拟合优度检验是检验样本的数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。拟合优度从对被解释变量 y 取值变化的成因分析入手。被解释变量 y 的变化可由两部分解释:第一,有 p 个解释变量 x 的变化引起的 y 的变化部分;第二,由其他随机因素引起的 y 的变化部分

3、。 定义由第一部分引起的 y 的变差平方和为 ESS,称为回归平方和;由随机因素引起的 y 的变差平方和称为剩余平方和 RSS, SST 称为总离差平方和,其中有 TSS=ESS+RSS 定义多重判定系数是多元线性回归中回归平方和占总平方和的比例,计算公式为:TSRE12度量了多元回归方程的拟合优度,反映了回归方程所能解释的变差的比2R例,该统计量越接近于 1,模型的拟合优度越高。 在应用过程中发现,如果在模型中增加一个解释变量, 往往增大,这2R就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的 的增大与拟合好坏无关, 需调2R2整。从而

4、引入调整后的 。在样本容量一定的情况下,增加解释变量必定使得2R自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:)1/(2nTSk其中:n-k-1 为残差平方和的自由度,n-1 为总体平方和的自由度。南昌航空大学统计学课程案例研究 - 3 -2.2 回归方程的检验在已知回归系数 的条件下,还需对整个回归方程进行显著性检k,21验。在对整个回归方程进行显著性检验时通常是构造 统计量,类似的, 检FF验时仍需四个步骤:提出原假设和备择假设:原假设 ,备择假设 ;0:210kH 不 全 为 零kH,:21作统计量: ,其中 SSR 为残差

5、平方和,SSE 为回归平方和,)/(1nSERF(k-1),(n-k)分别为 SSR,SSE 的自由度;根据样本数据和原假设计算统计量 的值;F将统计量 的值与临界值 相比较,若 的值大于临界值 ,则需拒绝原F F假设 ,说明回归方程显著。反之,则需接受原假设 ,说明回归方程不显0H0H著。2.3 回归系数的检验运用计算方法或者通过计算机的运行可以得出回归系数 的估计,k,21但所估计的回归系数在给定的显著性水平 下是否具有显著性呢?这需要给予相应的显著性检验,通常是构造 统计量。那么在进行 检验过程中需遵循以下t t四个步骤:提出原假设和备择假设:原假设 ,备择假设 ;),21(,0:kjH

6、j ),21(,0:1kjHj 作统计量: ,其中 为 的标准差;jStjjj南昌航空大学统计学课程案例研究 - 4 -根据样本数据和原假设计算统计量 的值;t将统计量 的值与临界值 相比较,若 的绝对值大于临界值 ,则拒绝原假tt t设 ,说明 显著不为零。反之,则接受原假设 ,说明 显著为零。0Hj0Hj3. 多元线性回归的应用案例研究(见附件)【附件】国内旅游收入因素研究分析多元线性回归分析(南昌航空大学经济管理学院,江西省南昌市,330063)摘要:旅游业作为我国国民经济的重要产业之一,在我国的经济建设中发挥了巨大的作用。我国旅游业经历了改革开放 30 年的发展,已初步形成了 “大旅游

7、、大产业、大 发展”的基本格局,具备了一定的产业体系和 产业规模, 进入了前所未有的大 发展时代。近年来,旅游 业作为国民经济的增长点一直保持高速发展,在整个社会 经济发 展中的作用日益显现。 21 世纪随着中国加入 WTO 和知识经济的发展,国内旅游收入迅速增加,远高于同期 GDP 的增长率。为了对国内旅游收入影响因素进行研究分析,本文 选取了国内旅游 总花费、国民 总收入、人均国民生产总值、居民消费水平和城 乡居民人民币储蓄存款年底余 额五个因素,采集了我国19942012 年的数据,运用 SPSS 软件进行数据分析。1. 模型设定为了全面反映中国“国内旅游收入”的情况,选择国内旅游总花费

8、作为被解释变量,以反映国内旅游收入情况;选择“国民总收入”、 “人均国民生产总值”、 “居民消费水平”及“城乡居民人民币储蓄存款年底余额”作为自变量;以此来分析国内旅游收入影响因素情况。 从国家统计局收集到以下数据(见表 1)南昌航空大学统计学课程案例研究 - 5 -表 1 国内旅游总花费及相关数据时间 国内旅游总花费(亿元)国民总收入 (亿元)人均国内生产总值(元)居民消费水平(元)城乡居民人民币储蓄存款年底余额(亿元)2012 年 22,706.22 516,810.0538,459.47 14,098 399,551.002011 年 19,305.39 468,562.3835,197

9、.79 12,570 343,635.892010 年 12,579.77 399,759.5430,015.05 10,522 303,302.492009 年 10,183.69 340,319.9525,607.53 9,283 260,771.662008 年 8,749.30 316,030.3423,707.71 8,430 217,885.352007 年 7,770.62 266,422.0020,169.46 7,310 172,534.192006 年 6,229.70 215,904.4116,499.70 6,299 161,587.302005 年 5,285.86

10、183,617.3714,185.36 5,596 141,050.992004 年 4,710.71 159,453.6012,335.58 5,032 119,555.392003 年 3,442.27 134,976.9710,541.97 4,475 103,617.652002 年 3,878.36 119,095.699,398.05 4,144 86,910.652001 年 3,522.37 108,068.228,621.71 3,887 73,762.432000 年 3,175.54 98,000.45 7,857.68 3,632 64,332.381999 年 2,8

11、31.92 88,479.15 7,158.50 3,346 59,621.831998 年 2,391.18 83,024.28 6,796.03 3,159 53,407.471997 年 2,112.70 78,060.85 6,420.18 3,002 46,279.801996 年 1,638.38 70,142.49 5,845.89 2,789 38,520.801995 年 1,375.70 59,810.53 5,045.73 2,355 29,662.30南昌航空大学统计学课程案例研究 - 6 -1994 年 1,023.51 48,108.46 4,044.00 1,83

12、3 21,518.801、1980 年以后国民总收入(原称国民生产总值)与国内生产总值 的差额为国外净要素收入。【数据来源:国家统计局】2. SPSS 软件分析求解图 1 数据输入及处理南昌航空大学统计学课程案例研究 - 7 -表 1 多元线性回归结果(1)V ariables E ntered/R em oved a ( ) .S tepw ise(C riteria:P robability-of-F-to-enter= .100). ( ) .S tepw ise(C riteria:P robability-of-F-to-enter= .100).M odel12V ariables

13、E ntered V ariablesR em oved M ethodD ependent V ariable: ( )a. 表一表示引入的自变量是居民消费水平和人均国内生产总值,其他两个变量均被移除模型表 2 多元线性回归分析结果(2)Model Summaryc.980a .960 .957 *.985b .971 .967 * .595Model12R R Square AdjustedR Square Std. Error ofthe Estimate Durbin-WatsonPredictors: (Constant), ()a. Predictors: (Constant),

14、(), ()b. Dependent Variable: ()c. 从表 2 可以看出,只含有一个自 变量居民消费水平的回归 方程,其 调整后的 =0.957,而2R含有两个自变量居民消费水平和人均国内生产总值的回归方程,其调整后的 =0.967,表明后者的拟合程度要高于前者。南昌航空大学统计学课程案例研究 - 8 -表 3 多元线性回归分析结果(3)ANOVAc6E+008 1 627825308.7 405.136 .000a26344285 17 1549663.8357E+008 186E+008 2 317551644.2 266.482 .000b19066305 16 11916

15、44.0917E+008 18RegressionResidualTotalRegressionResidualTotalModel12Sum ofSquares df Mean Square F Sig.Predictors: (Constant), ()a. Predictors: (Constant), (), ()b. Dependent Variable: ()c. 表 3 是两个方程的方差分析表。两个回归方程 F 统计量的显著水平都接近 0,表明两个方程都是显著的。表4 多元线性回归分析结果(4)表 4 是两个方程的回归系数估计值和回归系数 t 检验。由表中数据可知,第一个方程只有一个解释变量,回归系数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号