医学统计学课件--多元线性回归分析(第15章)

上传人:wt****50 文档编号:50687930 上传时间:2018-08-09 格式:PPT 页数:62 大小:983.50KB
返回 下载 相关 举报
医学统计学课件--多元线性回归分析(第15章)_第1页
第1页 / 共62页
医学统计学课件--多元线性回归分析(第15章)_第2页
第2页 / 共62页
医学统计学课件--多元线性回归分析(第15章)_第3页
第3页 / 共62页
医学统计学课件--多元线性回归分析(第15章)_第4页
第4页 / 共62页
医学统计学课件--多元线性回归分析(第15章)_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《医学统计学课件--多元线性回归分析(第15章)》由会员分享,可在线阅读,更多相关《医学统计学课件--多元线性回归分析(第15章)(62页珍藏版)》请在金锄头文库上搜索。

1、Multiple Linear Regression Analysis多元线性回归分析多元线性回归分析第第1515章章第二军医大学卫生统计学教研室张罗漫Date1医学统计学讲课内容讲课内容第一节 多元线性回归(重点)第二节 自变量选择方法(重点)第三节 多元线性回归的应用及注意事项Date2医学统计学第一节第一节 多元线性回归多元线性回归一、多元线性回归模型Date3医学统计学Date4医学统计学多元回归:多个Y,多个X 多重回归:一个Y,多个XDate5医学统计学0 常数项j 偏回归系数(partial regression coefficient):在其它自变量保持不变时,Xj增加或减少一

2、个单位时Y的平均变化量。 e 去除m个自变量对Y影响后的随机误差。Date6医学统计学多元线性回归模型应用条件:1.Y与X1,X2,Xm之间具有线性关系;2.各个Yi间相互独立;3.e服从均数为0、方差为2的正态分布。Date7医学统计学多元线性回归分析步骤:1.根据样本数据求得模型参数估计值:2.对回归方程及各Xj作假设检验。Date8医学统计学二、多元线性回归方程的建立Date9医学统计学YXDate10医学统计学Date11医学统计学X1X2YDate12医学统计学用最小二乘法解正规方程组,使残差平方和Q最小。Date13医学统计学Date14医学统计学用最小二乘法解正规方程组, 使残差

3、平方和Q最小。Date15医学统计学Date16医学统计学Date17医学统计学Date18医学统计学三、多元线性回归方程的假设检验及评价Date19医学统计学(一)回归方程的假设检验及评价1.方差分析法不全为0。Date20医学统计学Date21医学统计学Date22医学统计学2.决定系数R2血糖含量变异的60%可由总胆固醇、甘 油三酯、胰岛素和糖化血红蛋白的变异 解释。Date23医学统计学3.复相关系数RY与多个自变量间的线性相关程度;Y与估计值 间的Pearson相关系数r。Date24医学统计学(二)各自变量的假设检验及评价 1.偏回归平方和表示模型中含有其它m-1个自变量的条件下该

4、自变量对Y的回归贡献。其值愈大说明相应的自变量愈重要。Date25医学统计学Date26医学统计学0.6129+11.9627+20.0635+27.7939133.7107Date27医学统计学胰岛素(X3)与糖化血红蛋白(X4)与血糖(Y)有 线性回归关系。Date28医学统计学2.t检验法Date29医学统计学胰岛素(X3)与糖化血红蛋白(X4)与血糖(Y) 有线性回归关系。Date30医学统计学标准化回归系数bj 的绝对值用来比较各个 自变量Xj 对Y的影响程度大小;绝对值越 大影响越大。标准化回归方程的截距为0。3.标准化回归系数p标准化回归系数与一般回归方程的回归系数的关系:标准化

5、回归方程p Date31医学统计学对血糖影响大小的顺序依次为糖化血红蛋 白(X4)、胰岛素(X3)、甘油三酯(X2)与总胆 固醇 (X1)。胰岛素为负向影响。Date32医学统计学第二节第二节 自变量选择方法自变量选择方法Date33医学统计学一、全局选择法对自变量各种不同的组合所建立的回归方程进行比较,从全部组合中挑出一个“最优”的回归方程。Date34医学统计学uR2可用来评价回归方程优劣。u随着自变量增加,R2不断增大,对两个不同个数自变量回归方程比较,须考虑方程包含自变量个数影响,应对R2进行校正。u所谓“最优”回归方程指 最大者。1.校正决定系数 选择法Date35医学统计学uP为方

6、程中自变量个数。u最优方程的Cp期望值是p+1。应选择Cp最接近P+1的回归方程为最优。2. 选择法Date36医学统计学Date37医学统计学二、逐步选择法n全局选择计算量很大:6个变量,计算26-1=63个方程;10个变量,计算210-1=1023个方程。n按选入变量顺序不同分前进法、后退法与逐步回归法,共同特点是每一步只引入或剔除一个自变量Xj。Date38医学统计学n对Xj的取舍要进行F检验:计算进行到第l步时:p :方程中自变量个数SS回:Xj的偏回归平方和SS残:残差平方和Date39医学统计学1.前进法(只选不剔) 开始方程中无自变量,然后从方程外选取偏 回归平方和最大的自变量作

7、F检验以决定是 否选入方程,直至无自变量可以引入方程为 止。缺点:后续变量的引入可能使先前引入的变量变的不重要。Xj入选Date40医学统计学2.后退法(只剔不选) 开始方程中包含全部自变量,然后从方程中 选取偏回归平方和最小的自变量作F检验以 决定是否从方程中剔除,直至无自变量可以 从方程中剔除为止。缺点:当某些自变量高度相关时,可能得不出正确结果。Xj剔除Date41医学统计学3.逐步回归法(先选后剔,双向筛选)p开始方程中无自变量,从方程外选取偏回归平方和最大的自变量作F检验以决定是否选入方程;p每引一个自变量进入方程后,从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除

8、;p直至方程外无自变量可引入,方程内无自变量可剔除为止。Date42医学统计学Xj剔除内剔Xj入选外引 入值定的越小选取自变量标准越严,被选入方程内自变量数越少。 入值越大则反之。 小样本:入=0.05,出=0.10。 大样本:入=0.10,出=0.15。 入出,以免Xj上一步剔除后下一步又被选入Date43医学统计学 选X4前先建立4个直线回归方程; 选X1前先建立1个含3个自变量、 3个含2个自变量的多元线性回归方程。Date44医学统计学Date45医学统计学Date46医学统计学Date47医学统计学Date48医学统计学Date49医学统计学第三节第三节 多元线性回归的应用及注意事项

9、多元线性回归的应用及注意事项Date50医学统计学一、多元线性回归的应用1.影响因素分析 年龄(X1)饮食习惯(X2)吸烟状况(X3)工作紧张度(X4)家族史(X5)高 血 压 (Y )bj的意义为在 其它自变量保 持不变时,Xj 增加或减少一 个单位时Y的 平均变化量。 故可排除混杂 因素。 Date51医学统计学2.估计与预测心脏表面积(Y)=b0+b1心脏横径(X1)+ b2心脏纵径(X2)+ b3心脏宽径(X3)新生儿体重(Y)=b0+b1胎儿孕龄(X1)+ b2 胎儿头径(X2)+ b3胎儿胸径(X3)+ b4胎儿腹径(X4)Date52医学统计学3.统计控制利用回归方程进行逆估计,

10、确定Y后控制X 。采用射频治疗仪治疗脑肿瘤:脑皮质毁损半径(Y)=b0+b1射频温度(X1)+ b2照射时间(X2)Date53医学统计学二、多元线性回归应用的注意事项1.指标的数量化 应变量Y为连续变量自变量X可为连续、有序分类或无序分类变量(1)连续变量:X(2)有序分类变量: 1 轻X= 2 中3 重Date54医学统计学(3)无序分类变量哑变量(dummy variables) Date55医学统计学2.样本含量n至少是X个数m的510倍3.多重共线性实际应用中非常普遍,可使最小二乘法建立的回归方程失效;消除方法:主成分回归;剔除某个造成共线性的自变量。Date56医学统计学4.变量间的交互作用某一自变量对Y的作用大小与另一自变量的 取值有关。 血糖(Y)与总胆固醇 (X1)、甘油三酯(X2)、胰岛 素(X3)、糖化血红蛋白(X4)间逐步回归方程:pX3与X4间有交互作用:Date57医学统计学5.残差分析标准化残差Date58医学统计学e0Date59医学统计学0000eeeeDate60医学统计学讲课内容讲课内容第一节 多元线性回归(重点)第二节 自变量选择方法(重点)第三节 多元线性回归的应用及注意事项Date61医学统计学Thank you!Date62医学统计学

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号