回归分析3逐步回归分析课件

上传人:M****1 文档编号:576390314 上传时间:2024-08-19 格式:PPT 页数:48 大小:485.50KB
返回 下载 相关 举报
回归分析3逐步回归分析课件_第1页
第1页 / 共48页
回归分析3逐步回归分析课件_第2页
第2页 / 共48页
回归分析3逐步回归分析课件_第3页
第3页 / 共48页
回归分析3逐步回归分析课件_第4页
第4页 / 共48页
回归分析3逐步回归分析课件_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《回归分析3逐步回归分析课件》由会员分享,可在线阅读,更多相关《回归分析3逐步回归分析课件(48页珍藏版)》请在金锄头文库上搜索。

1、回归分析(三)逐步回归分析1回归分析3逐步回归分析最优回归方程的问题寻求最优回归方程的问题在有p个自变量的情况下,根据自变量的不同组合可能建立2p-1个回归方程。这些回归方程的效果有好有坏,而人们希望的是回归效果最好的,即“最优”的回归方程最优回归方程的要求回归效果最佳自变量的个数最少选择一个最佳的变量组合一方面对因变量起显著作用的自变量都选进回归方程,另一方面对因变量作用不显著的自变量都剔除回归方程,2回归分析3逐步回归分析 选择最优回归方程的方法方法一:穷尽法从所有可能的变量组合中,选择其中最优的回归方程这种方法一定能选出一个最优组合,但工作量特别大方法二:逐步剔除法基本步骤:从包含全部p

2、个自变量组合的回归方程中逐个检验回归系数,剔除对因变量作用不显著的自变量;对剔除后剩下的q个自变量建立对因变量的多元回归方程,再逐个检验回归系数,剔除不显著的变量;重复上述步骤,直到保留在回归方程中自变量的作用都显著为止缺点:一开始把全部自变量都要引入回归方程,计算量很大,实际上有些不重要的就不必引入 3回归分析3逐步回归分析方法三:逐步引入法(1)基本步骤:先逐个比较 xl,xp 对 y 的回归方程那些是显著的,从显著的方程中挑选 F 值最大的,相应的自变量 x 就被“引入”方程。无妨设 x 就是x1再逐个比较(x1,x2)、(x1,x3)、(x1,xp)对y的回归方程,看有没有F值显著的,

3、此时的F就是考虑添加xi之后, xi的回归系数是否显著地不为0,将显著的F中最大的F所相应的变量“引入”方程。无妨设第二次“引入”的自变量是x2再考察以x1、x2为基础,逐个添加x3、x4、xp之后的回归方程,是否较x1、x2的方程有显著的改进,有就再“引入”新的自变量,这样下去,终于到某一步就没有可以再“引入”的自变量了。这时就获得了最后的回归方程4回归分析3逐步回归分析方法四:逐步回归分析方法按照自变量对因变量所起作用的显著程度,从大到小逐个地引入回归方程当每一变量引入以后,若先前已经引入的变量由于后来变量的引入而使其作用变得不显著时,就及时从回归方程中剔除出去,直到作用显著的变量都引入到

4、回归方程,而作用不显者的变量都剔出回归方程,得到一个最佳的变量组合为止(2) “逐步引入“法的缺点: 不能反映后来变化的状况,设想x1、x2、x3引入后,又引入了x6,也许x3、x6引入后,x1的作用就不重要了,应该予以剔除,而“逐步引入”法不能达到这个要求5回归分析3逐步回归分析逐步回归分析的几个问题一、建立标准正规方程组二、变量的引入、剔除与消去法的关系6回归分析3逐步回归分析一、建立标准正规方程组为了分辨 p个自变量对因变量 Y 所起影响(或作用)的大小,一个自然的想法是比较各自变量回归系数 (j1,2,p)的绝对值的大小。根据回归系数的含义,Xj 的回归系数 是在其余p1个自变量保持不

5、变的条件下,Xj 改变一个单位所引起 Y 平均变化的大小。因而回归系数绝对值的大小反映了它所代表的因素的重要程度由于回归系数和自变量所取的单位(或数量级)有关,而各个自变量取不同的量纲的情况是常见的,因而不能将回归系数直接进行比较7回归分析3逐步回归分析建立标准正规方程组为了消除这个影响,对自变量和因变量都要加以标准化标准化的方法经过标准化的变量,其均值为 0,标准离差Lxjxj为 1事实上,8回归分析3逐步回归分析标准正规方程组由标准化数据建立的正规方程组的系数矩阵即为变量间的相关系数矩阵相关系数矩阵,称为标准化正规方程组标准化正规方程组为:9回归分析3逐步回归分析标准正规方程组标准化正规方

6、程组的解 称为标准回归系标准回归系数数,其常数项 为0由于因变量也进行了标准化,其总离差平方和 Lyy=1求解标准化正规方程组还需要解决以下两个问题 引入变量和剔除变量的标准; 引入变量与剔除变量的方法。10回归分析3逐步回归分析二、变量的引入、剔除与消去法的关系 假定已有 l 个自变量引入到回归方程,即相应的平方和分解公式是为了表明 U 和 Q 与引入的自变量是有关的,分别用符号U(x1,xl) 和 Q(x1,xl) 表示11回归分析3逐步回归分析当增加一个自变量 xi ( i = l+1, p ) 后,有了新的回归方程,相应的平方和分解公式是原来的分解公式是注意到上两式左端 Lyy 是一样

7、的,当xi 引入后,回回归平方和归平方和从 U(x1,xl) 增加到U(x1,xl ,xi) ,而残差平方和残差平方和从 Q(x1,xl) 降到 Q(x1,xl ,xi)12回归分析3逐步回归分析因此,有记 ui就是回归方程中引入 xi 后对回归平方和的贡献,即偏回归平方和偏回归平方和偏回归平方和偏回归平方和,且有13回归分析3逐步回归分析经F 检验,当 xi 作用显著时,可将其引入。同理同理,如果 xi 原来已经在回归方程中,若检验后其作用不显著,可及时从回归方程中剔除出去。利用统计量因此,取剔除和引入变量 xi的标准相同,即14回归分析3逐步回归分析在逐步回归中引入一个变量与剔除一个变量都

8、涉及变换,变换公式相同,采用求解求逆紧凑格式求解求逆紧凑格式在第在第s 次对次对第第k 列列消去的变换公式是:消去的变换公式是:二、变量的引入、剔除与消去法的关系15回归分析3逐步回归分析由相关矩阵构成的系数矩阵中,第 i 个变量的偏回归平方和ui(s)为:由 可推倒出来ui(s) 为下一步引进变量的指标,每一步引入都是从未出现在回归方程的剩余变量中挑选ui(s)的最大者进行上述变换后,回归分析中的剩余平方和剩余平方和Q的值即为系数矩阵中ryy位置所得的结果。即有,(证明)16回归分析3逐步回归分析式中,l 为先前已经引入到回归方程中的变量个数,Fi 服从F(1,n-l-2)分布。如果已引进的

9、变量中有不显著的,则选其最不显著者作剔除变换,然后再检验。在未引入的变量中检验有无回归显著的变量,若有,则挑选最显著的作引入的消去变换,然后再检验。反复进行,直到没有变量可以引进,也没有变量可以从方程中剔除为止。构造检验统计量17回归分析3逐步回归分析n用消去法求解正规方程组的过程二、变量的引入、剔除与消去法的关系当消去正规方程组系数矩阵的第一列时,常数项列的第一个数就是只有只有x1这一个自变量情况下这一个自变量情况下所建立的回归方程的回归系数 这是因为:当回归方程只有一个自变量时,表明其他自变量在多元回归方程中的回归系数为0。因此,正规方程的常数项部分就是该变量的解,即回归系数。18回归分析

10、3逐步回归分析二、变量的引入、剔除与消去法的关系第二次消去了正规方程组系数矩阵的第一、二两列时,常数项列中的第一、二两个数即为只只有有x1, x2两个自变量情况下两个自变量情况下所建立回归方程的回归系数 和 依次类推,得到引入的各个自变量的回归系数系数矩阵中每消去一列,等价于回归方程中引系数矩阵中每消去一列,等价于回归方程中引入一个新的变量,而且与变量排列的顺序无关。入一个新的变量,而且与变量排列的顺序无关。19回归分析3逐步回归分析 由相关系数矩阵得到的回归系数是标准回归系数 ,如果要把它化为一般回归系数 两者关系为:其中 Lii 和LYY为变量 Xi 和 Y 的方差。二、变量的引入、剔除与

11、消去法的关系推导20回归分析3逐步回归分析三、例题分析【例】 某种水泥在凝固时,放出的热量Y(卡克)与水泥中下列4种成分有关: X1:铝酸三钙 X2:硅酸三钙 X3:铁铝硅四钙 X4:硅酸二钙 通过试验,取得数据资料如右所示:编号号X1X2X3X4Y12345678910111213711111711312211111026295631525571315447406668615886917221842398605220473322644222634121278.574.3104.287.695.9109.2102.772.593.1115.983.8113.3109.421回归分析3逐步回归分

12、析说明:按第一种方法选最优,全部可能的回归方程有C41+C42+C43+C44=15个计算各要素之间的相关系数,得到相关系数矩阵R(0)准备工作:22回归分析3逐步回归分析根据本例资料,算出从矩阵R(0)中可以看出: x1与x2 两因子不相关,x2与x4、x1与x3之间关系密切,x3与y关系不太密切,x4与y最相关 23回归分析3逐步回归分析逐步回归步骤:逐步回归步骤:计算公式:计算公式:计算公式:计算公式:t变换步数第一步(t =1) 选择第一个变量进入回归方程选择第一个变量进入回归方程 对所有4个变量,按下面公式计算偏回归平方和当变量引入回归方程后24回归分析3逐步回归分析 计算结果为:比

13、较4个ui(1),可知第4个因子的偏回归值最大,即x4对y的回归贡献最大,于是优先考虑选入x425回归分析3逐步回归分析引入因素的显著性检验引入因素的显著性检验其中,分子的自由度是1,l 为方程中的变量个数n求解回归方程时,若对资料进行标准化处理,可以证明:统计量26回归分析3逐步回归分析当引入第一个因子时,l1故则统计量于是由于F4(1) F0.05(1,11)=4.84,表明引入的因子x4对回归方程的贡献是显著的,应将x4引入方程。27回归分析3逐步回归分析矩阵矩阵R(0) 的高斯亚当变换(紧凑变换方式)的高斯亚当变换(紧凑变换方式)以x4为主元进行矩阵变换(x4刚刚引入方程),变换公式如

14、下a.非主元所在行、列b.主元所在行(除主元)c.主元所在列(除主元)d.主元n 变换过程要求按a d 顺序进行。28回归分析3逐步回归分析记变换后的矩阵为R(1),(t =1) 解29回归分析3逐步回归分析x4引入回归方程后的结果引入回归方程后的结果标准回归系数(利用标准化数据求得的回归系数)为:剩余平方和回归方程的标准形式标准形式为:其中l1,表明方程只引入一个变量30回归分析3逐步回归分析回归方程的一般形式一般形式为:一般回归系数为:常数项为31回归分析3逐步回归分析第二步 (t =2)选择第二个变量进入回归方程选择第二个变量进入回归方程选择第二个变量进入回归方程选择第二个变量进入回归方

15、程计算偏回归平方和 ui(2) (i=1,2,3)(利用R(1)对不在回归方程中的每个变量做计算) 其中以u1(2)=0.2980最大,故最优先考虑 x1 引入回归方程(能否引入方程要做检验)。7A32回归分析3逐步回归分析引入变量的检验(引入检验)引入变量的检验(引入检验)引入变量的检验(引入检验)引入变量的检验(引入检验)偏回归系数检验偏回归系数检验式中,分母表示x1引入回归方程后,剩余平方和 等于只包含x4一个变量时的剩余平方和 减去x1引入回归方程而使回归平方和增大的部分 。 n由于F1(2) F0.05(1,10) = 4.96 ,因此x1应引入回归方程中。将x1引入,方程中有两个因

16、子,即l = 233回归分析3逐步回归分析矩阵矩阵R(1)的高斯亚当变换的高斯亚当变换 记变换后的矩阵为记变换后的矩阵为R(2)引入因子引入因子引入因子引入因子x x1 1后,对原有因子后,对原有因子后,对原有因子后,对原有因子x x4 4重新检验(偏回归重新检验(偏回归重新检验(偏回归重新检验(偏回归检验)检验)检验)检验) 剔除检验剔除检验剔除检验剔除检验因为因为F4(2) F0.05(1,10) ,因此,因此 x4 不应从方程不应从方程中剔除。中剔除。 *(2) 解 *(2) 解即以即以x1的回归方程引入的回归方程引入x4后的偏后的偏回归显著性检验,其中,回归显著性检验,其中, x1的回

17、的回归贡献为归贡献为0.5339,而,而x4的偏回归的偏回归贡献为贡献为0.4385的,合计为的,合计为0.972434回归分析3逐步回归分析将将将将x x1 1引入回归方程的结果引入回归方程的结果引入回归方程的结果引入回归方程的结果标准回归系数:标准回归系数:回归方程的一般形式:回归方程的一般形式:剩余平方和:剩余平方和:35回归分析3逐步回归分析第三步(t = 3)选择第三个变量引入回归方程选择第三个变量引入回归方程选择第三个变量引入回归方程选择第三个变量引入回归方程计算偏回归平方和ui(3) (i=2,3)(利用R(2)对不在回归方程中的每个变量做计算) n其中 u2(3) u3(3)

18、,变量x2的偏回归平方和最大,选择x2引入检验引入检验引入检验引入检验 偏回归系数检验偏回归系数检验偏回归系数检验偏回归系数检验36回归分析3逐步回归分析矩阵矩阵R(2)的高斯亚当变换的高斯亚当变换 引入引入x2,以以r22(2)为主为主元进行,记变换后的矩阵为元进行,记变换后的矩阵为R(3)引入引入x2后,对原有因子后,对原有因子x1、x4重新检验重新检验(l=3) 剔除检验剔除检验 *(3) 解 *(3) 解 *(3) 解上式表示,以上式表示,以x2为自变量的方程,再引入为自变量的方程,再引入x1、x4后,产生的偏回归贡献后,产生的偏回归贡献37回归分析3逐步回归分析其中u4(3)较小,计

19、算由于 ,因此,应把 x4 从回归方程中剔除。n说明:由于因子x2的引入,造成变量x4的显著性大大降低,回归方程中变量x4的存在是多余的,予以剔除。38回归分析3逐步回归分析矩阵矩阵 R(3) 以以 r44(3) 为主元做高斯亚当变换,记为主元做高斯亚当变换,记变换后的矩阵为变换后的矩阵为R(4) *(4) 解 *(4) 解39回归分析3逐步回归分析剔除剔除x4后,再检验后,再检验x1、x2因由于 均大于F=4.10,所以x1、x2均不剔除。40回归分析3逐步回归分析第四步引入新变量引入新变量计算偏回归平方和n因为 ,且x4是刚刚在上一步中被剔除的变量,故不需要再作F检验就知道它不显著 再没有

20、变量可引入回归方程,逐步回归选因子结束41回归分析3逐步回归分析第五步第五步第五步第五步 逐步回归方程的建立逐步回归方程的建立逐步回归方程的建立逐步回归方程的建立引入变量x1、x2后,由R(4)得到标准回归系数:原方程的回归系数其中因而42回归分析3逐步回归分析回归方程为:回归方程为:回归方程为:回归方程为:剩余平方和:估计标准误差:复相关系数:方程方程F检验:检验:43回归分析3逐步回归分析END44回归分析3逐步回归分析n 证明如下:在第0步,还没有因子引入回归方程,剩余方差Q(0)达到最大,即在第一步,引入因子 ,k1是1,2, ,m中的任一个数,剩余方差为45回归分析3逐步回归分析第二步,继续引入因子 , ,k2也是1,2, , m 中一个数。这时,如此下去,我们讨论第 l 步第 l 步,继续引入因子 ,kl 也是1,2, ,m中一个数。这时 ,证毕46回归分析3逐步回归分析求解求逆紧凑变换法设方程组为47回归分析3逐步回归分析回归方程的标准形式标准形式也可以写成因此,一般形式一般形式回归方程的回归系数为48回归分析3逐步回归分析

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号