数学建模多元线性回归分析ppt课件

上传人:ni****g 文档编号:578494276 上传时间:2024-08-24 格式:PPT 页数:50 大小:800.50KB
返回 下载 相关 举报
数学建模多元线性回归分析ppt课件_第1页
第1页 / 共50页
数学建模多元线性回归分析ppt课件_第2页
第2页 / 共50页
数学建模多元线性回归分析ppt课件_第3页
第3页 / 共50页
数学建模多元线性回归分析ppt课件_第4页
第4页 / 共50页
数学建模多元线性回归分析ppt课件_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《数学建模多元线性回归分析ppt课件》由会员分享,可在线阅读,更多相关《数学建模多元线性回归分析ppt课件(50页珍藏版)》请在金锄头文库上搜索。

1、第十五章第十五章 多元线性回归分析多元线性回归分析(MultipleLinearRegression)1;.Multiple linear regression Choice of independent variable Application2;. 讲述内容讲述内容第一节第一节 多元线性回归多元线性回归第二节第二节 自变量选择方法自变量选择方法第三节第三节 多元线性回归的应用多元线性回归的应用 及其注意事项及其注意事项3;.目的:作出以多个自变量估计因变量的多元线性回归方程。资料:因变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。意义:由于事

2、物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。4;.第一节第一节 多元线性回归多元线性回归5;.变量:应变量变量:应变量1个,自变量个,自变量m 个,共个,共m+1个。个。样本含量:样本含量:n数据格式见表数据格式见表15-1回归模型一般形式:回归模型一般形式:一、多元线性回归模型一、多元线性回归模型6;.表15-1多元回归分析数据格式 条件条件7;.一一般般步步骤骤建立回归方程(2)检验并评价回归方程检验并评价回归方程及各自变量的作用大小及各自变量的作用大小8;.二、多元线性

3、回归方程的建立例15-127名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。9;.表15-227名糖尿病人的血糖及有关变量的测量结果 10;.求偏导数原 理最小二乘法11;.三、假设检验及其评价 1.方差分析法:方差分析法:(一)对回归方程12;.表15-4例15-1的方差分析表 表15-3 多元线性回归方差分析表13;.2.决定系数决定系数R 2:14;.3.复相关系数复相关系数 15;.(二)对各自变量指明方程中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。1.偏回归平方和 16;.

4、17;.表表15-5对例对例15-1数据作回归分析的部分中间结果数据作回归分析的部分中间结果 各各自自变变量量的的偏偏回回归归平平方方和和可可以以通通过过拟拟合合包包含含不不同同自自变变量量的的回回归归方方程程计算得到,表计算得到,表15-515-5给出了例给出了例15-115-1数据分析的部分中间结果。数据分析的部分中间结果。18;.结结果果19;.2.t 检验法是一种与偏回归平方和检验完全等价的一种方法。计算公式为20;.结结 果果结结 论论21;.3标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。计算得到的回归方程称作标准化回归方程,相应的回归系数即为

5、标准化回归系数。 22;.注意:注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,变量保持不变时, 增加或减少一个单位时增加或减少一个单位时Y Y的平均变化量的平均变化量 。不能用各。不能用各 来来比较各比较各 对对 的影响大小。的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大小,标准化回归系数无单位,用来比较各自变量对应变量的影响大小, 越大,越大, 对对 的影响越大。的影响越大。23;.结结论论24;.第二节自变量选择方法 目的目的:使得预报和(或)解释效果好25;.一

6、、全局择优法目的:预报效果好意义:对自变量各种不同的组合所建立 的回归方程进行比较 择优。选择方法:26;.27;.28;.例15-2 用全局择优法对例15-1数据的自变量进行选择。 29;.二、逐步选择法1.1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。此法已基本淘汰。2.后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。3.逐步回归法

7、,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。 30;.31;.表15-7逐步回归过程 32;.表15-8例15-3方差分析表 “最优”回归方程为结果表明:血糖的变化与甘油三脂、胰岛素和糖化血红蛋白有线性回归关系,其中与胰岛素负相关。由标准化回归系数看出,糖化血红蛋白对空腹血糖的影响最大。 33;.表15-9例15-3的回归系数的估计及检验结果 34;.第三节多元线性回归的应用及注意事项35;.一、多元线性回归的应用36;.1.影响因素分析 例如影响高血压的因素可能有年龄、饮食习惯、吸烟状况、工作紧张度和例如影响高血压的因素可能有年龄、饮食习惯、吸烟状况、

8、工作紧张度和家族史等,在影响高血压的众多可疑因素中,需要研究哪些因素有影响,哪家族史等,在影响高血压的众多可疑因素中,需要研究哪些因素有影响,哪些因素影响较大。些因素影响较大。37;. 在临床试验中,则可能由于种种原因难以保证各组的指标基线相同,如在年在临床试验中,则可能由于种种原因难以保证各组的指标基线相同,如在年龄、病情等指标不一致出现混杂的情况下,如何对不同的治疗方法进行比较龄、病情等指标不一致出现混杂的情况下,如何对不同的治疗方法进行比较等。等。 这些问题都可以利用回归分析来处理。控制混杂因素这些问题都可以利用回归分析来处理。控制混杂因素( (confoundingfactor) )的

9、一个简单办法就是将其引入回归方程中,与其他主要变量一起进行分析的一个简单办法就是将其引入回归方程中,与其他主要变量一起进行分析 38;.2.估计与预测如由儿童的心脏横径、心脏纵径和心脏宽径估计心脏的表面积;由胎儿的孕如由儿童的心脏横径、心脏纵径和心脏宽径估计心脏的表面积;由胎儿的孕龄、头颈、胸径和腹径预测出生儿体重等。龄、头颈、胸径和腹径预测出生儿体重等。 39;.3.统计控制逆估计。 例如采用射频治疗仪治疗脑肿瘤,脑皮质的毁损半径与射频温度及照射例如采用射频治疗仪治疗脑肿瘤,脑皮质的毁损半径与射频温度及照射时间有线性回归关系,建立回归方程后可以按预先给定的脑皮质毁损半径,时间有线性回归关系,

10、建立回归方程后可以按预先给定的脑皮质毁损半径,确定最佳控制射频温度和照射时间。确定最佳控制射频温度和照射时间。 40;.二、多元线性回归应用的注意事项二、多元线性回归应用的注意事项1指标的数量化指标的数量化 分2类,可用一个(0,1)变量。如性别分k类,k-1个(0,1)变量,如血型。41;.数据格式回归方程 建立回归方程建立回归方程 b1 :相当相当A型相对于型相对于O型的差别型的差别b2 :相当:相当B型相对于型相对于O型的差别型的差别b3 :相当:相当AB型相对于型相对于O型的差别型的差别42;.(3)等级 定量。一般是将等级从弱到强转换为(或)如文化程度分为小学、中学、大学、大学以上四

11、个等级。Y为经济收入。解释:b(b1)反映X(X1) 增加1个单位, 增加b个单位(如:500元)。表示中学文化较小学收入多500,大学较中学多500,余类推。43;.b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小大小也可将K个等级转换为K-1个(0,1)变量44;.2样本含量:n=(510)m。3关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为和选入的变量是,而不是,结果发生了改变。不同回归方程适应于不同用途,依专业知识定。45;.4.多重共线性即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果:(1)参数估计值的标准误变得很大,从而t值变得很小。(2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。(3)t检验不准确,误将应保留在模型中的重要变量舍弃。(4)估计值的正负符号与客观实际不一致。消除多重共线性:剔除某个造成共线性的自变量,重建回归方程;合并自变量;采用逐步回归方法。 46;.47;.48;.49;.50;.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号