第#页共16页研究生课程考核试卷(适用于课程论文、提交报告)科目数理统计姓名:xxx专业:机械工程教师:学号:类别:刘琼荪20150702xxx学术上课时间:2016年3月至2016年4月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入xl、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素利用SPSS和exce1软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因关键词:民航客运量影响因素回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。
民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位从上述事实可以看出我国民航的发展所取得的成果显著当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等%为了研究过去的情况,从中国统计年鉴⑵得到1994年统计摘要,分析类似因素对我国航空客运量的影响二、数据描述如下为所得统计数据:表11978-1993年统计数据年份y民航客运量(万人)x1国民收入(亿元)x2消费额(亿元)x3铁路客运量(万人)x4民航航线里程(万公里)x5来华旅游入境人数(万人)1978231301018888149114.89180.921979298335021958638916420.391980343368825319220419.53570.251981401394127999530021.82776.711982445425830549992223.27792.4319833914736335810604422.91947.719845545652390511035326.021285.2219857447020487911211027.721783.319869977859555210857932.432281.95198713109313638611242938.912690.231988144211738803812264537.383169.481989128313176900511380747.192450.14199016601438496639571250.682746.21991217816557109699508155.913335.651992288620223129859969383.663311.519933383248821594910545896.084152.7三、模型建立:(1)提出假设条件,明确概念,引进参数;参考相关书籍⑶,设随机变量民航客运量为Y(万人),解释变量X,X,12X,X,X分别为国民收入(亿元),消费额(亿元),铁路客运量(万人),345民航航线里程(万公里),来华旅游入境人数(万人),且回归函数E(YIX二x,X二x,…,X二x)二卩+卩x+…+卩x,称11225501155Y二卩+Px+•••+卩x+8,EE=0,D£=DY=U2,为多元线性回归模型,01155卩,卩,…,卩为回归系数,8为随机误差。
015(x,x,•••,x,y),i=1,2,•••,5为上述来自多元线性回归模型的样本值,满足:i1i2i5i(y=P+px++卩x+8,E8=0,D8=CT2,i=1,2,•••,5,
所以首先考虑回归模型为多元线性模型四、模型求解采用最小二乘估计法求解模型参数,采用SPSS软件计算,得到如下结果:表2拟合过程小结模刑摘要b模刑RR平方调整后的R平方标准估算的错误Durbin-Watson(U)r1.999a.998.99749.492401.993a. 预测变量:(常量),x5,x3,x4,x2,x1b. 因变量:y表3方差分析ANOVAa模刑平方和白由度均方F显著性r1回归13818876.76952763775.3541128.303.000b残差24494.981102449.498总计13843371.75015a. 因变量:yb. 预测变量:(常量),x5,x3,x4,x2,x12015-2016年第二学期研究生“应用数理统计”课程课外作业表4回归过程统计量模型非灯\仕“歹;来灯标准系数+显著性卄姓小片血^丄B1U/JXSZA标准错误标准系数贝+塔容许VIF(常量)4509091780782532030x2—561125—2485—44780010011740508x1354085244741520020011963337x3—.007.002—.083—3.510.006.3153.171x421.5784.030.5315.354.000.01855.488x5435052564844000004025193a.因变量:y散点图1-因变量:yIIIII-10123回归标准化贖菱4第9页共16页回归标准化预测值图6残差图则回归方程为y二450.909+0.354x-0.561x-0.007x+21.578x+0.435x1 2345五、模型分析检验(1)决定系数由决定系数R2=0.998看出回归方程高度显著。
2)方差分析表F二1128.303,P值=0.000,这说明x,x,x,x,x整体上对y有高度显著的影响1 2345(3)回归系数的显著性检验(t检验):回归系数的显著性检验由显著性一列看出自变量的回归系数都通过了t检验(即收尾概率小于规定的显著性水平0.05),说明5个自变量对y的影响显著其中x铁路客运量的显著性为0.006最大,但仍小于5%3(4)检验残差序列的自相关性(D-W检验):D-W=1.993n2所以认为模型不存在序列的自相关性6)异方差检验从残差图看出所有点落在±2之间,没有明显变化趋势,所以认为8〜NGe),i=1,2,•••5i综上,认为用最小二乘估计的方法估计的模型理论上是有效的7)模型进一步分析(国民消x的VIF5虽然,模型通过了检验,但是由之前的图可知x与y正相关,但x2 2费额)的回归系数是负值,显然是矛盾的,同时x和x的VIF很大,x,124也大于10,其原因是自变量之间的共线性,因而回归模型还要就共线性问题进行谈论如下表是各变量之间的相关系数:表5相关系数表肯德尔taubx1x2x3x4x5相关系数显著性(双尾)■N相关系数显著性(双尾)■N相关系数显著性(双尾)■N相关系数显著性(双尾)■N相关系数显著性(双尾)■N相关系数显著性(双尾)N1.000——16.933**.000——16.933**.000——16.367*.048——16.933**.000——16.933**.00016相关性—xl.933**.000161.000161.000**——16.400*.031——16.967**.000——16.933**.00016x2—.933**.000161.000**—161.000——16.400*.031——16.967**.000——16.933**.00016x3—.367*.04816— 400*.03116— 400*.03116—1.000—16.367*.048—16.400*.0314.933**.000——16.967**.000——16.967**.000—。