多元回归及逐步回归分析

上传人:kms****20 文档编号:46574051 上传时间:2018-06-27 格式:PDF 页数:33 大小:230.93KB
返回 下载 相关 举报
多元回归及逐步回归分析_第1页
第1页 / 共33页
多元回归及逐步回归分析_第2页
第2页 / 共33页
多元回归及逐步回归分析_第3页
第3页 / 共33页
多元回归及逐步回归分析_第4页
第4页 / 共33页
多元回归及逐步回归分析_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《多元回归及逐步回归分析》由会员分享,可在线阅读,更多相关《多元回归及逐步回归分析(33页珍藏版)》请在金锄头文库上搜索。

1、多元回归及相关上海交通大学医学院生物统计 宋艳艳上海交通大学医学院生物统计 宋艳艳定义: 是研究一个因变量(反应变量)和多个自变量组合 之间是否存在线性依存关系。因变量:结果变量 自变量:原因变量定义: 是研究一个因变量(反应变量)和多个自变量组合 之间是否存在线性依存关系。因变量:结果变量 自变量:原因变量基本概念基本概念应用条件:应用条件: 1、自变量和应变量之间的关系是线性关系。 2、各观测单位相互独立。 3、残差服从正态分布。 4、残差满足方差齐性。1、自变量和应变量之间的关系是线性关系。 2、各观测单位相互独立。 3、残差服从正态分布。 4、残差满足方差齐性。xbby10+=b bi

2、 i (partial regression coefficient)(partial regression coefficient) 当其它各自变量的作用被固定时,当其它各自变量的作用被固定时,x xi i改变一 个单位时改变一 个单位时y y平均改变的量。平均改变的量。mmxbxbxbby+ +=22110常数项偏回归系数常数项偏回归系数各自变量与因变量之间不呈现线性关系各自变量与因变量之间不呈现线性关系33221102 3322112 3322110,lg,lgzbzbzbbyxzxzxzxbxbxbbY+=+=令二、拟和回归方程二、拟和回归方程例7.1 测得某地29名13岁男童身高(c

3、m),体 重(kg)及肺活量(L),求由身高、体重推 算肺活量的回归方程。(P例7.1 测得某地29名13岁男童身高(cm),体 重(kg)及肺活量(L),求由身高、体重推 算肺活量的回归方程。(P125125)的计算:最小二乘法)的计算:最小二乘法22110xbxbby+=ib多元回归的计算多元回归的计算kykkkkkykkykkjjiiijiiiyiiyyiiiilblblbllblblbllblblblxxxxlyyxxlyylxxl=+=+=+=?2211222221211121211122)()()()()()(kkxbxbxbyb=?22110210541. 00050. 0565

4、7. 0XXY+=三、多元回归方程的显著性检验:三、多元回归方程的显著性检验:1.整个方程的全局性检验:F 检验整个方程的全局性检验:F 检验H0: 1=2=0H1: 1,2至少有一个不等于至少有一个不等于0回归 平方 和回归 平方 和QUlyy+=总的离 均差平 方和剩余 平方 和总的离 均差平 方和剩余 平方 和剩余回归剩余剩余回归回归MSMSdfSSdfSSF=(1) t检验 H0:J=0 H1:J 0 t=bj/S(bj) t的临界值 t(n-k-1)2. 对各偏回归系数的显著性检验2. 对各偏回归系数的显著性检验(2) F检验:(2) F检验:x xj j的偏回归平方和是否有统计学意

5、 义。H的偏回归平方和是否有统计学意 义。H0 0:j j=0, H=0, H1 1:j j0,0,) 1/(),(1/ ),|(),(),(),|(:11111111111=+pnxxSSExxxxxSSRFxxxxSSRxxSSRxxxxxSSRxppjjj jpjjppjjjj?的偏回归平方和由检验结果可看出: 多元回归方程不能保证每个自变量都 有统计学意义由检验结果可看出: 多元回归方程不能保证每个自变量都 有统计学意义四、多元回归方程的分析四、多元回归方程的分析yyiiiillbb =标准偏回归系数:用于评价各指标对y的作用大小两指标标准偏回归系数之间差异有无统计学意义 使用t检验标

6、准偏回归系数:用于评价各指标对y的作用大小两指标标准偏回归系数之间差异有无统计学意义 使用t检验6673. 063362. 5/11793.8570541. 00932. 063362. 5/95315.19570050. 021 =bb1、标准偏回归系数1、标准偏回归系数2、多元相关系数及决定系数2、多元相关系数及决定系数R-多元相关系数。它是y与之间的简单相关系 数,或y与自变量组合之间的相关系数 RR-多元相关系数。它是y与之间的简单相关系 数,或y与自变量组合之间的相关系数 R2 2决定系数。其取值范围为:0 R决定系数。其取值范围为:0 R2 21 Y的变异中被方程中的自变量的组合解

7、释的比重。1 Y的变异中被方程中的自变量的组合解释的比重。y 总回 ssss lURyy=2决定系数的用途 可用于检验回归方程的显著性。决定系数的用途 可用于检验回归方程的显著性。H H0 0: : 2 2=0H=0H1 1: : 2 20 0 ()1,)1 (/12122=kndfkdfRkknRF的可信区间 y y(y(1)nmyts, y(1)n myts+12yymggssx Cx=3、预测值均数的可信区间3、预测值均数的可信区间4、预测个体值的容许区间4、预测个体值的容许区间 y(y(1),n myts(1)n myts+121yymggssx Cx=+应用:解释和预报 1、通过对各

8、自变量的偏回归系数和标准偏回归 系数来反映和比较各自变量对应变量的作用大 小。 2.确定自变量和应变量的数量关系。应用:解释和预报 1、通过对各自变量的偏回归系数和标准偏回归 系数来反映和比较各自变量对应变量的作用大 小。 2.确定自变量和应变量的数量关系。01 122mmybb xb xb x=+五、多元回归方程的应用五、多元回归方程的应用3.确定各自变量x3.确定各自变量xi i取不同值时,应变量Y的正常 值范围和可信区间。4.根据较易测得的自变量推算不易测算的应变 量。5.回顾推断取不同值时,应变量Y的正常 值范围和可信区间。4.根据较易测得的自变量推算不易测算的应变 量。5.回顾推断六

9、、偏相关系数六、偏相关系数)1 (122 jkikjkikijkijrrrrrr=)()(,定义:当把x定义:当把x1 1, x, x2 2以外的其他变量对他们的 影响都扣除掉(或平衡掉)以后, x以外的其他变量对他们的 影响都扣除掉(或平衡掉)以后, x1 1, x, x2 2之间 的相关系数.之间 的相关系数.Proc corr data=a; Var x1; With y; Partial x2; Run;第八章逐步回归(stepwise regression)第八章逐步回归(stepwise regression)1、逐步回归的目的 最优方程:方程中的每个自变量都对 应变量有统计学意义

10、。逐步回归保证 了拟和出的方程是局部最优方程。2、衡量回归方程的标准2、衡量回归方程的标准1、剩余标准差1、剩余标准差 建立多元回归方程,其精确性由剩余标准 差来表达。建立多元回归方程,其精确性由剩余标准 差来表达。 ) 1/(,2, 1 .=LNQSLY2、决定系数 3、校正复相关系数:与用剩余标准差筛选 出的方程常是一致的。4、AIC-反应了回归方程的拟和精度,其 值越小越好 5、CP2211(1)11r adj TMSnRRnpMS= = 逐步回归(stepwise regression)yx1、x2 、x3 、xmxjXj是否统计 学意义不进入引入方程方程内自变量 中选择对y作 用最小

11、的xi剔除留在方程无无有无设对以下变量进行统计分析yx1,x2, xma) y= x1; y= x1; y= xm?p1, p2, pm如果min(p1, p2, pm)。 ?在模型中增加一个变量或减少一个变量,引 起回归系数估计值有较大的变化。应检查数据是否正确 样本的代表性 检查变量定义等问题 强影响点 要考虑自变量之间是否高度的线性相 关性或某个自变量可用其他自变量线 性表示。即:多重共线性问题?一个变量,从专业上看,本来就是由另外变 量派生出来的。 如人体的脉压差; 4水平的文化程度变量改变成4个二态变量 时,其中一个必是由另外3个派生出来的。 ?当样本数(n)少于变量数时(m),m个变量 之间,必然自动地会产生出(m-n)个共线性变 量。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号