第四章 多重共线性

上传人:夏** 文档编号:508483562 上传时间:2023-11-14 格式:DOC 页数:7 大小:215KB
返回 下载 相关 举报
第四章 多重共线性_第1页
第1页 / 共7页
第四章 多重共线性_第2页
第2页 / 共7页
第四章 多重共线性_第3页
第3页 / 共7页
第四章 多重共线性_第4页
第4页 / 共7页
第四章 多重共线性_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《第四章 多重共线性》由会员分享,可在线阅读,更多相关《第四章 多重共线性(7页珍藏版)》请在金锄头文库上搜索。

1、第四章 多重共线性一、填空题1. 在多元线性回归模型中,解释变量间呈现近似线性关系的现象为_问题,给计量经济建模带来不利影响,因此需检验和处理它。2. 在回归分析中,当检验回归系数所得的t值不显著时,我们往往将它归结为多重共线性。但也可能是其他原因的影响,如 或 。3. 存在多重共线时,回归系数的标准差趋于 ,t值趋于 。方差膨胀因子越大,OLS估计量的 将越大。4. 检验样本是否存在多重共线性的常见方法有:_ 、 和 。5. 处理多重共线性的方法主要有两大类:_和_。二、问答题1. 简述多重共线性的含义。2. 简述多重共线性的后果。3. 方差膨胀因子(Variance Inflation F

2、actor, VIF)及其含义?4. 列举多重共线性的检验方法。5. 多重共线性的补救办法?6. 假设在模型中,与之间的相关系数为零,于是有人建议你进行如下回归:(1) 是否存在且?为什么?(2) 会等于或或某两个的某个线性组合吗?(3) 是否有且?7. 在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗

3、?为什么?8克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:括号中的数据为相应参数估计量的标准误。试对上述模型进行评析,指出其中存在的问题。9. 将下列函数以适当的方法消除多重共线性 (1)消费函数为:,式中C、W、P分别表示消费、工资收入和非工资收入,W与P可能高度相关,但研究表明。 (2)需求函数为:,式中Q、Y、P、Ps 分别表示需求量、收入水平、该商品价格及其替代品价格水平,P、Ps可能高度相关。三、实践题1. 下表给出了中国商品进口额Y、国内

4、生产总值GDP、消费者价格指数CPI。年份商品进口额(亿元)国内生产总值(亿元)居民消费价格指数(1985=100)19851257.88964.410019861498.310202.2106.519871614.211962.5114.319882055.114928.3135.819892199.916909.2160.219902574.318547.9165.219913398.721617.8170.819924443.326638.1181.719935986.234634.4208.419949960.146759.4258.6199511048.158478.1302.819

5、9611557.467884.6327.9199711806.574462.6337.1199811626.178345.2334.4199913736.482067.5329.7200018638.889468.1331.0200120159.297314.8333.3200224430.3105172.3330.6200334195.6117251.9334.6资料来源:中国统计年鉴,中国统计出版社2000年、2004年。请考虑下列模型:(1) 利用表中数据估计此模型的参数。(2) 你认为数据中有多重共线性吗? (3) 进行以下回归:根据这些回归你能对数据中多重共线性的性质说些什么?(4)

6、 假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?2. 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1 (代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1

7、985-2002年期间的统计数据,具体如下:年份YX1X2X3X4X5X6X71985766828989.18964.43448.7417.9406.921.368.2919868085010201.410202.23967.0525.7475.623.268.3219878663211954.511962.54585.8665.8544.926.467.4819889299714922.314928.35777.2810.0661.031.266.5419899693416917.816909.26484.0794.0786.035.366.5119909870318598.418547.9

8、6858.0859.41147.542.467.2199110378321662.521617.88087.11015.11409.746.965.9199210917026651.926638.110284.51415.01681.854.666199311599334560.534634.414143.82284.72123.261.267.32199412273746670.046759.419359.63012.62685.972.765.2199513117657494.958478.124718.33819.63054.783.571.05199613894866850.56788

9、4.629082.64530.53494.093.171.5199713779873142.774462.632412.14810.63797.2101.869.23199813221476967.278345.233387.95231.44121.3106.669.44199913011980579.482067.535087.25470.64460.3118.170.45200013029788254.089468.139047.35888.05408.6132.470.96200113491495727.997314.842374.66375.45968.3144.670.4120021

10、48222103935.3105172.345975.27005.06420.3156.369.78资料来源:中国统计年鉴2004、2000年版,中国统计出版社。要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。参考答案一、填空题1.多重共线性;2.设定偏误;模型的理论依据不强。3. 无穷大;很小;标准差。4.简单相关系数;可决系数法;参数t检验的显著性。5. 差分法;逐步回归法。二、问答题1. 答:对于K元线性回归模型 , i=1,2,n 其基本假设之一

11、是解释变量之间是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。如果存在 , i=1,2,n 其中l不全为0,即某一个解释变量可以用其它解释变量的线性组合表示,则称为完全共线性。2. 答:在多重共线性存在的情况下,OLS估计量仍然保持BLUE的性质。虽然OLS估计量可以得到,但极不稳定,数据资料即使有极小的变化,估计值及标准差就会有很敏感的反应。估计量的方差随着共线程度的增加而变大,如果达到完全共线,估计量的方差就会为无限大。随着共线程度的增加,对于回归系数所进行的t检验,接受原假设的概率加大,即回归系数可能变得不显著。但与此同时,可以得到较高的可决系数(R2),如果模

12、型的用途是预测,那么,高度的多重共线未必不是好事。3. 答:回归系数的OLS估计量的方差为:,可以看作随机项方差乘上一个比例常数,这个比例常数称为方差膨胀因子,即可以证明: 式中i=1,2,k, 表示回归模型中引入了k个解释变量X。为作为被解释变量,与其余k-1个X 进行多元回归分析后得到的可决系数。如果越大,说明与其余k-1个X的多重共线程度越高,得到的就会表现出越大。为了综合评价OLS估计时出现的多重共线性的程度,可以采用平均膨胀因子: 一般认为超过10(也有人主张超过5)时,就认为多重共线的程度较高,必须加以处理。4. 答:主要有相关系数法、可决系数检验法和方差膨胀因子法。诊断多重共线性

13、最直接的办法就是观察解释变量之间的相关系数,由此可以观察发生在解释变量之间的相关程度的大小。如果是在回归分析完成之后考察多重共线性的存在,那末,重要变量的回归系数如果没有通过t 检验, 或回归系数的数值与符号与预期严重不符,可以认为存在多重共线问题。由于引入模型中的解释变量有多个,到底是哪一个导致了多重共线的后果,可以采用可决系数法来判别。方差膨胀因子法(VIF)也是诊断多重共线性的常用方法。5. 答:多重共线性存在的情况下最简单的补救办法就是弃掉一个共线变量。一般地,减轻多重共线性从三个方面考虑:样本方面、解释变量方面和模型的形式方面。样本方面。主要是考虑加大样本容量,增加数据小数点后的位数,目的是降低解释变量序列之间成比例的可能性。解释变量方面。应用面板数据估计模型,或利用来自经济理论和以往经验的先验信息,用以消除多重共线对估计模型的影响。逐步回归法是常用的一种多重共线性存在时选择解释变量的方法。逐步回归法。要排除多重共线性产生的不良后果,软件操作中应用较多的是逐步回归法。逐步回归法的基本思想是:将Y分别对每一个X作回归模型(K个),选一可决系数R2最大者,作为基础方程。将其余R2由小到大排队,将X按R2由大到小的顺序逐次加入基础方程。有三种情况:a.加入某个X后, R2提高,t检验显著,保留该X;b.加入某个X后, R2没改善,剔除该X;c

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号