回归分析中的主要问题

上传人:飞*** 文档编号:2631243 上传时间:2017-07-26 格式:DOC 页数:20 大小:388.50KB
返回 下载 相关 举报
回归分析中的主要问题_第1页
第1页 / 共20页
回归分析中的主要问题_第2页
第2页 / 共20页
回归分析中的主要问题_第3页
第3页 / 共20页
回归分析中的主要问题_第4页
第4页 / 共20页
回归分析中的主要问题_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《回归分析中的主要问题》由会员分享,可在线阅读,更多相关《回归分析中的主要问题(20页珍藏版)》请在金锄头文库上搜索。

1、第 7 章 回归分析中的主要问题一、 基本概念几个主要关系式: bxay)(Eixn1iyn1iixs122)( iiys122)(niiixy xCov12 )()(yxysr2xyxysrxnxybxbyna 2222 )(1),(iyx ),(iyx ),(yx1 2 3 )()(32)1iii yy 2222 11)(1)( yeiiiii sSTotalEyyyr 222 )()(xyi rSTotalRy)1/()1)/()(22 knRknSTotalFi多元回归模型: kxbay1多元回归分析的前提条件: 因变量与自变量的关系是“一次” ,即“线性” 。现实中这种关系本质上往往

2、是非线性的。 残差相互独立 方差齐性,残差的方差为常数或因变量的方差为常数。 残差服从正态分布,或因变量围绕其均值服从正态分布。关于通过原点(常数项强制为零):大多数情况下回归方程的常数项不为零,除非是一些明显的情况,如涉及到增量的情形。一般说来带常数项的回归方程更准确一些。二、 多元回归分析中的非线性问题及其解释单变量情况:例:下表中的数据为锻炼对人体免疫系统影响的数据。其中 y 为血液中的免疫珠蛋白数量(lgG) ,表示长期免疫的效果, x 为最大吸氧量,表示人体的健康状况。对象 y 为血液中的免疫珠蛋白数量(lgG)x 为最大吸氧量对象 y 为血液中的免疫珠蛋白数量(lgG)x 为最大吸

3、氧量1 881 34.6 16 1660 52.52 1290 45.0 17 2121 69.93 2147 62.3 18 1382 38.84 1909 58.9 19 1714 50.65 1282 42.5 20 1959 69.46 1530 44.3 21 1158 37.47 2067 67.9 22 965 35.18 1982 58.5 23 1456 43.09 1019 35.6 24 1273 44.110 1651 49.6 25 1418 49.811 752 33.0 26 1743 54.412 1687 52.0 27 1997 68.513 1782 61

4、.4 28 2177 69.514 1529 50.2 29 1965 63.015 969 34.1 30 1264 43.2Maxmal Oxgen uptake in milliliters per kilogram807060504030lgGin milligrams2200200018001600140012001000800600尽管原始数据中只有一个自变量,但是从散点图上不难看出它们之间存在着很强的非线性关系,而且是二次函数性质。因此可以想象出它们的回归关系式应该是: exbay21或者, , 其中21 2x对上述方程利用计算机进行回归计算,得到如下主要结果,Model Sum

5、mary.968a .938 .933 106.43Model1 R R SquareAdjusted RSquare Std. Error ofthe EstimatePredictors: (Constant), XX, Maxmal Oxgen uptake inmilliliters per kilograma. ANOVAb4602210.6 2 2301105.316 203.159 .000a305818.33 27 11326.6054908029.0 29RegressionResidualTotalModel1 Sum ofSquares df Mean Square F

6、Sig.Predictors: (Constant), XX, Maxmal Oxgen uptake in milliliters perkilograma. Dependent Variable: lgG in milligramsb. Coefficientsa-1464.404 411.401 -3.560 .00188.307 16.474 2.574 5.361 .000-.536 .158 -1.628 -3.390 .002(Constant)Maxmal Oxgen uptakein milliliters perkilogramXXModel1 B Std. ErrorUn

7、standardizedCoefficientsBetaStandardizedCoefficientst Sig.Dependent Variable: lgG in milligramsa. 即 2.07.840.16 xy这里 的系数小于零,意味着随着 x 的增加,其作用是使 y 开始减少。如果 的系2x 2x数大于零,意味着随着 x 的增加加速 y 的增加。即散点图的形式的不同,系数的符号也不同。多变量情况:例:下表数据为旧钟表拍卖的价格与它的年龄和参与竞拍的人数之间的关系。拍卖价格 y 年龄 x1 竞拍人数 x2 拍卖价格 y年龄x1 竞拍人数 x21235 127 13 2131

8、170 141080 115 12 1550 182 8845 127 7 1884 162 111522 150 9 2041 184 101047 156 6 854 143 61979 182 11 1483 159 91822 156 12 1055 108 141253 132 10 1545 175 81297 137 9 729 108 6946 113 9 1792 179 91713 137 15 1175 111 151024 117 11 1593 187 81147 137 8 785 111 71092 153 6 744 115 71152 117 13 1356

9、194 51336 126 10 1262 168 7注意自变量 x1 和 x2 之间可能有相互作用,也可能没有相互作用,如果不存在相互作用则回归方程显然是普通一阶线性二元回归,如果存在相互关系,则回归方程中则应该包含其乘积项,即 x1 x2。如何检验其相互作用关系的存在与否,可以通过散点图进行。对上例中的数据作出相应的散点图,从上图中可看出 x1 和 x2 之间确实存在相互作用,因此对应的回归方程就该为: exbxay21321利用计算机计算的主要结果如下:X1y X2=15X2=10X2=5不存在相互作用 X1y X2=15X2=10X2=5存在相互作用Model Summaryb.977

10、a .954 .949 88.3674 2.416Model1 R R SquareAdjusted RSquare Std. Error ofthe Estimate Durbin-WatsonPredictors: (Constant), X1X2, AGE, BIDDERSa. Dependent Variable: PRICEb. Correlations1.000 .730 .395 .858.730 1.000 -.254 .364.395 -.254 1.000 .792.858 .364 .792 1.000. .000 .013 .000.000 . .081 .020.01

11、3 .081 . .000.000 .020 .000 .32 32 32 3232 32 32 3232 32 32 3232 32 32 32PRICEAGEBIDDERSX1X2PRICEAGEBIDDERSX1X2PRICEAGEBIDDERSX1X2Pearson CorrelationSig. (1-tailed)NPRICE AGE BIDDERS X1X2ANOVAb4572548.0 3 1524182.662 195.188 .000a218646.23 28 7808.7944791194.2 31RegressionResidualTotalModel1 Sum ofS

12、quares df Mean Square F Sig.Predictors: (Constant), X1X2, AGE, BIDDERSa. Dependent Variable: PRICEb. Coefficientsa322.754 293.325 1.100 .281.873 2.020 .061 .432 .669 .082 12.153-93.410 29.708 -.675 -3.144 .004 .035 28.2511.298 .211 1.370 6.150 .000 .033 30.458(Constant)AGEBIDDERSX1X2Model1 B Std. Er

13、rorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig. Tolerance VIFCollinearityStatisticsDependent Variable: PRICEa. 注意这里竞拍人数 x2 的系数为负数,不能简单地认为人数越多,竞拍价格越低,因为竞拍人数 x2 的系数实际上是: 10.29)5(298.413132 xb即当拍卖钟表年龄为 150 年时,每增加一位竞拍人数,拍卖价格上升 101.29 元。上述结果中卖钟表年龄的系数不太显著,说明还可以优化。尽管如此,此结果仍然可以与没有 x1 x2 项的回归

14、结果相比较,结论是上述结果明显要好一些。下面是没有 x1 x2 项的计算结果:Model Summaryb.945a .893 .885 133.1365 1.864Model1 R R SquareAdjusted RSquare Std. Error ofthe Estimate Durbin-WatsonPredictors: (Constant), BIDDERS, AGEa. Dependent Variable: PRICEb. ANOVAb4277159.7 2 2138579.852 120.651 .000a514034.52 29 17725.3284791194.2 31

15、RegressionResidualTotalModel1 Sum ofSquares df Mean Square F Sig.Predictors: (Constant), BIDDERS, AGEa. Dependent Variable: PRICEb. Coefficientsa-1336.722 173.356 -7.711 .00012.736 .902 .888 14.114 .000 .936 1.06985.815 8.706 .620 9.857 .000 .936 1.069(Constant)AGEBIDDERSModel1 B Std. ErrorUnstandar

16、dizedCoefficientsBetaStandardizedCoefficientst Sig. Tolerance VIFCollinearityStatisticsDependent Variable: PRICEa. 通过上述两个例子可以看出线性回归模型实际上有许多不同表示方式,以下是几种常用形式:一阶线性模型(k 个独立自变量): kxbay1一阶相互关联模型(三个独立自变量): 326315214321 xb二阶相互关联模型(三个独立自变量): 298217326315214321 xbxbxbay其他模型可照此类推。三、 乘法模型现实世界中常常会出现变量的值随着数值的增大,波动的幅度也增大。如因变量为产品的销售额、工资收入、股票价格等货币值的情况。一般情况下使用的加法模型可以表示为: )(yE上式中,不论 y 的大小如何,其波动程度或方差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号