多元回归分析2 0k

上传人:飞*** 文档编号:52335077 上传时间:2018-08-20 格式:PPT 页数:47 大小:324.50KB
返回 下载 相关 举报
多元回归分析2 0k_第1页
第1页 / 共47页
多元回归分析2 0k_第2页
第2页 / 共47页
多元回归分析2 0k_第3页
第3页 / 共47页
多元回归分析2 0k_第4页
第4页 / 共47页
多元回归分析2 0k_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《多元回归分析2 0k》由会员分享,可在线阅读,更多相关《多元回归分析2 0k(47页珍藏版)》请在金锄头文库上搜索。

1、 Multi Regression Analysis 多元回归分析童新元 中国人民解放军总医院 2005年11月1日在医学中,往往要研究两个定量 变量间的相互关系。如人体的血压和 脉搏,身高和体重等。统计学中的相 关与回归是研究两个变量线性关系的 最基本的方法。 l一、直线相关与回归回顾 y 。 。 。 。 。 。 。 。 。 。 X 散 点 图线性相关线性相关是用相关系数r来表示 两个变量X,Y间的直线关系。相关系数r的计算公式其绝对值愈接近1,两个变量间的直 线相关愈密切,愈接近0,线性相关 愈不密切。相关系数r没有单位, 在-1+1范围内波动。相关分析的步骤(1)作散点图(2) 计算相关

2、系数r(3) 相关系数检验 CHISS的实现点击 统计统计推断相关矩阵例9-1 测得某地10名3岁儿童的体重(kg )与体表面y(103cm2)积,试对该资料 进行直线相关分析。当两变量间存在着性线关系时,不 仅可以用相关系数r表示变量Y与X线性 相关的密切程度,还可以用一个二元 一次方程来表示。 直线回归 其中:CHISS的实现点击 多元分析线性回归例9-3 Wainwright等(1988)在进行营 养学实验前,先对小鼠体重与每窝 小鼠只数间的关系进行了研究。从 每窝分别为3只至12只的小鼠中,每 个窝别大小随机抽取两窝。在出生 后第32天测量不同窝别小鼠的平均 体重,结果见下表。试作回归

3、分析 。 回归方程的应用 -预测与估计 求出回归方程后,如果方程拟合度好话,可根据X的值来求Y预测值 典型统计案例1 肾脏为不规则体,怎样测量? 立方体体积规律:公式: V=长*宽*高=abca 肾脏体积的测量bc肾脏体积计算公式: 经验公式: V=/4*长*宽*高公式怎样产生的?肾脏体积测量实验用20个肾脏标本,测量计录每 个体积及其长,宽,高的数据: 采用什么方法找规律呢? 回归方程的构造: y = a+b*x V=/4*长*宽*高实验的回顾编编编编 号号体体 积积积积V V长长长长a a宽宽宽宽b b高高c c1 10010 52.52 11010 62.63 10511 52.1 .

4、. .影响公式的因素:测量误差 模型的选择二、多元线性回归分析 直线相关与回归分析一个自变量 和一个因变量间的关系, 在医学实践 中,常会遇到一个应变量与多个自 变量数量关系的问题。如医院住院 人数不仅与门诊人数有关, 而且可能 与病床周转次数, 床位数等有关, 多 元回归分析正是为解决这些问题而 产生的 。 多元线性回归模型通过实验测得含有p个自变量x1,x2,x3,xp 及一个因变量y的n个观察对象, 利用最小二 乘法原理, 建立多元线性回归模型:Yb0+b1X1+b2X2+bpXp。 其中b0为截距, b1 ,b2 bp称为偏回归 系数. bi表示当将其它m-1个变量的作用加以固定后,

5、Xi改变1个单位时Y的平均值Y将改 变bi个单位.1)多元回归分析的前提条件(1) 线性 给定X1,X2,Xp的数值后, 相应的y随机变动, 其总体均数y=b0+b1x1+b2x2+.bpxp (2) 独立 n个个体之间互相独立; (3) 正态 给定X1, X2, , Xp的数值后, 相应的y值服从正态分布; (4) 等方差 当X1,X2,Xp的数值变动时,相应的y有相同的方差。 2)多元回归方程的建立1) 求回归系数常用最小二乘估计的方法求解待定系数 b0和偏回归系数b1、b2bp。2)回归方程的检验 由样本计算得到的回归方程是总体回 归的估计。多元回归方程有没有意义需 要作假设检验,采用的

6、是方差分析。3)样本计算得到的这些偏回归系数bi( i=1,2,p)是总体偏回归系数 (i=1,2p)的估计值。在建立起方程后有 必要对这些偏回归系数作检验。3)多元回归的作用(1) 建立回归模型:Y=0+1X1+2X2+pXp ; (2) 预测预报 若已知x1, x2 xm数值大小时, 通过 模型可以预测y的值以及估计y的变化范围 ; (3) 因素分析 找出对因变量y有显著影响的因素。 设研究问题中含有p个指标变量x1, x2,xp及Y. n个观察对象. 其数据结构为:编号 X1 X2 . XP y1 x11 x12 x1p y12 x21 x22 x2p y2 3 x31 x32 x3p

7、y3 n xn1 xn2 xnp yp4)数据结构5)CHISS的实现l点击 多元分析线性回归6)实例讲解 例10-1 为研究初生儿体重与胎儿的孕龄 、头径、胸径、腹径、股骨长的关系, 以预测初生儿体重,某医院用超声波测 得18名胎儿的有关指标值、测量时的孕 龄和出生时体重如表。试进行多元回归 分析。三、逐步回归在多元线性回归分析中,研究者往往是 根据自己的经验或借鉴他人的研究结果 选定若干个自变量,这些自变量对因变 量的影响作用是否都有统计学意义还有 待于考察。通过多元性线回归分析,常 常会发现其中有很多自变量对因变量的 影响无意义。 同时,也常会遇到自变量间存在共线性 的问题,影响到偏回归

8、系数估计和回归 方程的“质量”。 因此,在建立回归方程的过程中有必 要考虑对自变量进行筛选,挑选出若干 个与因变量作用较大的变量建立回归方 程。剔除那些对因变量没有多大影响的 变量,从而建立一个较理想、较稳定的 回归方程。1)逐步回归的思想事先给定挑选自变量进入方程的P界值( 缺省值P=0.1),开始方程中没有自变量 ,然后,按自变量对y的贡献大小由大到小 依次挑选进入方程,每选入一个变量,都 要对已在模型中的变量进行检验,对大于 剔除标准的变量要逐一剔除。逐步回归中F值的计算* 逐步选择变量每一步都在权衡得失的情形下决定变量的取或舍。每一步都作一次如下的检验:H0 : p个自变量为好H1 :

9、 p+1个自变量为好采用F作为统计量。SS残 (H0 )-SS残 (H1 ) F SS残 (H1 )/ (n-p-2)其中SS残 (H0 )表示用p个变量回归的残差平方和SS残 (H1 ) 表示用p+1个变量回归的残差平方和。若FF(界值),则拒绝H0 ,可决定增多相应的自变量; 否则,不拒绝H0 , 可决定不增加相应的自变量 。2) CHISS的实现点击 多元分析逐步回归例10-2 试对例10-1某医院用超声波 测得18名胎儿的有关指标值进行逐 步回归分析。 3)Pe和Ps的确定1 Pe, Ps 需要多次选取。 2 常取0.5, 0.4,0.3, 0.2, 0.1, 0.05. 3 剔除变量

10、的界值Ps要大于选进变量的 界值Pe四、衡量回归方程的标准采用不同的剔除变量方法,选入不 同剔除变量的标准;会得到不同的回归 方程,我们要根据实际问题,对每个变 量的单独作用、变量间的交互作用作出 恰当的评价。一般来说,当回归方程中 自变量个数增加,或多或少总能减少剩 余误差,提高模型的拟合精度,但势必 导致模型的复杂性。因此,在建立回归方程时,要遵循 一个原则,即“少而精”,具体地说:既要 尽可能地提高拟合的精度,又要尽可能 地使模型简单。这就需要有一个量化的 标准来衡量所得模型的“优”与“劣”。目前,常用的衡量方程好坏的标准 有如下几个:1) 决定系数R2 (复相关系数的平方) R2 =1-SS残/SS总= SS模/SS总, , 它表示在因变量y的总变异中可由回归方 程所解释部分的比例。0P70-78 例9-1至10-1P125 4149讲义在http:/WWW.CHISS.CN 下载中心

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号