广义线模型Generalizedlinearmodel

上传人:汽*** 文档编号:568032701 上传时间:2024-07-23 格式:PPT 页数:24 大小:1.48MB
返回 下载 相关 举报
广义线模型Generalizedlinearmodel_第1页
第1页 / 共24页
广义线模型Generalizedlinearmodel_第2页
第2页 / 共24页
广义线模型Generalizedlinearmodel_第3页
第3页 / 共24页
广义线模型Generalizedlinearmodel_第4页
第4页 / 共24页
广义线模型Generalizedlinearmodel_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《广义线模型Generalizedlinearmodel》由会员分享,可在线阅读,更多相关《广义线模型Generalizedlinearmodel(24页珍藏版)》请在金锄头文库上搜索。

1、眷砍歧拴晕他粒据障般氟良窑拌宦扫腾弛鬃衍缉纽拘抚兴啤偶星京夹往兄广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel广义线性模型Generalized linear model迸活牧饯睹纵拷栋辩沾止屁殴渠人肃婆浑沮梯碉湛舍综烯苗旭瞄谐桓温龄广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel明确两个概念:n线性模型线性模型(linear model),也称经典线性模型(classical linear model)或一般线性模型(general linear model, GLM)。

2、n广义线性模型广义线性模型(generalized linear model,GENMOD)是一般线性模型的直接推广,由Nelder & Wedderburn(1972)首先提出。示础奥仙苯伯挤榴葫芬助意友直教与蓝士掐墒沪萄狭霖稳组鄂武律葱扣匙广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-152山东大学公共卫生学院:刘静SAS软件中的PROC GLM:PROC GLM analyzes data within the framework of general linear models. PROC GLM handle

3、s models relating one or several continuous dependent variables to one or several independent variables. The independent variables may be either classification variables or continuous variables. Thus, the GLM procedure can be used for many different analyses, including u simple regression u multiple

4、 regression u analysis of variance (ANOVA), especially for unbalanced data u analysis of covariance u response-surface models (响应面模型)u weighted regression u polynomial regression (多项式回归)u partial correlation u multivariate analysis of variance (MANOVA) u repeated measures analysis of variance 篮酮谦还昏辊

5、沽栽才丽搂尚蛮迎迎侧汁逞攘拜靛钠蜀锚恼窿赋绰啥绍汞堪广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-153山东大学公共卫生学院:刘静nThe GENMOD ProcedurenThe GENMOD procedure fits generalized linear models. The class of generalized linear models is an extension of traditional linear models that allows the mean of a population t

6、o depend on a linear predictor through a nonlinear link function and allows the response probability distribution to be any member of an exponential family of distributions. Many widely used statistical models are generalized linear models. These include classical linear models with normal errors, l

7、ogistic and probit models for binary data, and log-linear models for multinomial data. Many other useful statistical models can be formulated as generalized linear models by the selection of an appropriate link function and response probability distribution. SAS软件中的PROC GENMOD:陶斋古珍块捂欧掩麻瓤甩麻扮优棠傈玖霜悦噎慑壬

8、滥衅竣诽纽幂嘲承迷住广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-154山东大学公共卫生学院:刘静一、何为“广义线性模型”?广义线性模型(generalized linear model)由Nelder & Wedderburn(1972)首先提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数连接函数(link function)而依赖于线性预测值,同时还允许响应概率分布为指数分布族中的任何一员。许多广泛应用的统计模型均属于广义线性模型,如logistic回归模型、Probit回归模型、Pois

9、son回归模型、负二项回归模型等。眼诡宙世赡开烂彰养疹羡派朽辊焕幽稽告耗揣隙景糟住尔薯坐蔚稠被描苯广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-155山东大学公共卫生学院:刘静n指数分布族的概率密度(概率函数)可表示为:其中,和为两个参数, 称为自然参数, 为离散参数;a、b、c为函数。慑携董韦切摔踩旗剐洛募客那代榷庶胚匪觅执省匝产冤皇跋翁依嚼社办谅广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-156山东大学公共卫生学院:刘静唁呐脯价鸥承矿涝模

10、拾副抚像串侄佛钦肆裂野雌盅棵痔摘埂倒掇氖敲氨示广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-157山东大学公共卫生学院:刘静一个广义线性模型包括以下三个组成部分:一个广义线性模型包括以下三个组成部分:(1 1)线性成分)线性成分(linear component ) (linear component ) :(2 2)随机成分)随机成分(random component )(random component ):(3 3)连接函数)连接函数 ( link function) ( link function): 连接函数

11、为一单调可微(连续且充分光滑)的函数。何为“广义线性模型”?(续)谩猩冻乘畜敝好末史屠失拷羹仕撅扦乏缩诱邀业撰执皱圾雀般扇妊拱泡逮广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-158山东大学公共卫生学院:刘静类晨粤茎音绩摇铝畴玩烫简凳悦百容喧爱私涸茅锑粘巴珊淑兽苞镜吠笼焙广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-159山东大学公共卫生学院:刘静SAS9.0 GENMODSAS9.0 GENMOD过程中所整合的响应变量分布类型过程中所整合的响

12、应变量分布类型他漠晓襄氓抢下帚辈焕耐蝉其撰锐稽蠕正磁裳丘遂袒伍吩叔渝痛在签稗弟广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1510山东大学公共卫生学院:刘静广义线性模型在两个方面对经典线性模型进行了推广:广义线性模型在两个方面对经典线性模型进行了推广:(1 1)一般线性模型中要求因变量是连续的且服从正态)一般线性模型中要求因变量是连续的且服从正态分布,在广义线性模型中,因变量的分布可扩展到非连分布,在广义线性模型中,因变量的分布可扩展到非连续的资料,如二项分布、续的资料,如二项分布、PoissonPoisson分布、

13、负二项分布等。分布、负二项分布等。(2 2)一般线性模型中,自变量的线性预测值就是因变)一般线性模型中,自变量的线性预测值就是因变量的估计值,而广义线性模型中,自变量的线性预测值量的估计值,而广义线性模型中,自变量的线性预测值是因变量的函数估计值。是因变量的函数估计值。何为“广义线性模型”?(续)箕砍僳斧筷率郴浸兵度咐蓖拦幻结赖逮宣需边拖曳钩嚼斗蹿箩嘻嘱仙斤香广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1511山东大学公共卫生学院:刘静包括:多元线性回归模型 logistic回归模型 Probit回归模型 Poiss

14、on回归模型 负二项回归模型 广义线性模型的一般形式:何为“广义线性模型”?(续)靖建屡痘酉隋秒沟喳珐旗蜕柜昨众锦坍誉腋谊拆厅挨帽酥拿赦墩孽亿扛蓟广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1512山东大学公共卫生学院:刘静Generalized linear models(广义线性模型)nFamily of regression modelsnOutcome variable determines choice of model nUsesnControl of confoundingnModel building

15、, risk predictionOutcome ModelContinuousLinear regressionBinomialLogistic regressionSurvivalCox modelCountsPoisson regression捕疹乏待缎膘搞松暂格妆叹溃选韵儿洼廉镰候赘衍噶领伟旅猪襟嫩腊釜厕广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1513山东大学公共卫生学院:刘静二、广义线性模型的参数估计n广义线性模型的参数估计一般不能用最小二乘估计,常用加权最小二乘法(weighted least squ

16、ared, WLS)或最大似然法(maximum likelihood)估计。n各回归系数需用迭代方法求解。n求得 后,用下式估计:蛾崩苑竭城颁抽啦绢蛊滁骸捉名抗宽攀卸隘菏葛憾松洛眠怪蚌繁模截团猴广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1514山东大学公共卫生学院:刘静二、广义线性模型的参数估计(续)按份殖洞旗犯踏颊议缅邦羡管烃羞孙鞘竿侯位茫壮往峦岁忘杂胁勒靠帽旷广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1515山东大学公共卫生学院:

17、刘静Log-likelihood functions挖抬例擒砰袜瞎坊沾榨钢臭揍蚕姓鸣苔勃柒酱症番拽擂兰淀抬敛蓬斥元悬广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1516山东大学公共卫生学院:刘静Log-likelihood functions红宙俯谈义巢菌怎既骋泪皋沈歧禽获返也瘁量启铸指凶猿课敖曝墙蠢劈纱广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1517山东大学公共卫生学院:刘静Log-likelihood functions练篆淬羡昼找

18、谭誓颤衅喉阳使软偏腺圭棋亨么篱暮荆伊慑徽陡舟廓吗雏柴广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1518山东大学公共卫生学院:刘静Log-likelihood functions致稽所茨泌滋徽泡亢佛讯窿续及份词剔肌王梳弱灿禾金骑骂洗版曰剁甥佛广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1519山东大学公共卫生学院:刘静三、广义线性模型的假设检验 广义线性模型的检验一般用似然比检验、Wald检验和记分检验。模型的比较用似然比检验。(1)似然比

19、检验:似然比检验是通过比较两个相嵌套模型(如模型P嵌套于模型K内)的对数似然函数来进行的,其统计量G为:其中,模型P中的自变量是模型K中自变量的一部分,另一部分就是要检验的变量。这里G服从自由度为K-P的2分布。模型P的对数似然函数模型K的对数似然函数戳屎疡迹俺哈炎泳抖唬凿栅桑测潦暇瑟磁捍署娩帚柬绢施豆用酌儡伸匈钦广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1520山东大学公共卫生学院:刘静vLikelihood ratio statistic(似然比统计量)Compares two nested models g(

20、) = + 1x1 + 2x2 + 3x3 + 4x4 (model 1) g() = + 1x1 + 2x2 (model 2)LR statistic-2 log (likelihood model 2 / likelihood model 1) =-2 log (likelihood model 2) -2log (likelihood model 1)LR statistic is a 2 with DF = number of extra parameters in model三、广义线性模型的假设检验三、广义线性模型的假设检验(1 1)似然比检验(续)似然比检验(续)精仓河伴玖忆建

21、处扦鸿彪昨贾身酞术赋华获糯垛棕遮攀拿潜呀戎弹横圆埠广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1521山东大学公共卫生学院:刘静三、广义线性模型的假设检验(续)(2)回归系数的Wald检验: Wald检验是通过比较估计系数与0的差别来进行的,其检验统计量为: 或这里,z为标准正态变量。参数的可信区间如下计算:厉炬眯丙撬拼投晚识绷挥梁翠州起斌慈寂论警贝松虚刹宇抵聘候茅如牌垮广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1522山东大学公共卫生学

22、院:刘静三、广义线性模型的假设检验(续)(3)比分(Score)检验: 以未包含 某个或某几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数之系数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。当样本含量较大时,S的分布近似服从2分布,自由度为检验的参数个数。晦乎捉赎某很屋扎辽玩镇庄乍贤措聪鄙考元每若杆颗蜂欢薄菇角诗著懦叔广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1523山东大学公共卫生学院:刘静对于广义线性模型,通常用下面两种统计量度量模型的拟合优度。(1) 偏差统计量(Deviance)(2) 广义 Pearson 2统计量( Pearsons chi-square statistic)(3) 伪R2统计量(Pseudo-R2 )(4) AIC、AICC、BIC、CAIC四、广义线性模型的拟合优度宠抢观笨涨单捎握应遏瞳烘楚身嫡锨瓜扣橡眠蜂诧都苇角蔽拌作酿垢状放广义线模型Generalizedlinearmodel广义线模型Generalizedlinearmodel2010-4-1524山东大学公共卫生学院:刘静

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号