多层线性模型twolevel好剖析

上传人:我** 文档编号:117858274 上传时间:2019-12-11 格式:PPT 页数:70 大小:404KB
返回 下载 相关 举报
多层线性模型twolevel好剖析_第1页
第1页 / 共70页
多层线性模型twolevel好剖析_第2页
第2页 / 共70页
多层线性模型twolevel好剖析_第3页
第3页 / 共70页
多层线性模型twolevel好剖析_第4页
第4页 / 共70页
多层线性模型twolevel好剖析_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《多层线性模型twolevel好剖析》由会员分享,可在线阅读,更多相关《多层线性模型twolevel好剖析(70页珍藏版)》请在金锄头文库上搜索。

1、多层线性模型简介 Introduction to HLM 北京师范大学心理学院 刘红云 hyliu 主要内容 n为什么要用多层线性模型? n回归分析模型回顾 n多层(多水平)数据特点 n什么是多层线性模型? nHLM发展 nHLM数学模型 nHLM常见简化模型 n两水平模型应用举例 n应该注意的问题 回归分析模型 回归分析模型的假设 n线性(Linearity) n误差正态分布( normally distributed) n误差方差齐性(homoskedastic) 在进行方差分析时,各个实验组 内部的方差彼此无显著差异,这是最重要 的一个假定,所以为了满足这个假定,常要做组内方差齐性检验

2、n误差或观测个体之间相互独立( independent) 什么是多层(多水平)数据? n多层(多水平)数据指的是观测数据在单位上 具有嵌套的关系。如学生嵌套于班级,班级嵌 套于学校等。 n同一单位内的观测,具有更大的相似性。同一 个班级的学生由于受相同的班级环境等因素的 影响有更大的相似性。 嵌套于背景(contextual)特征 的多层数据举例 n学生水平特征的观测,嵌套于班级或学校 n兄弟姊妹特征的观测,嵌套于家庭 n个体之间的观测嵌套于社区 n个体不同时间点的重复测量嵌套于个体 n病人嵌套于医院 n参数的估计嵌套于不同的研究 (元分析,meta-analysis) 对多层数据,我们了解什

3、么. n随机选取两个观测,同一组内的观测之间的相似性要 比不同组观测之间的相似性大; n如果回归模型不能解释所有的组间的差异(事实上传 统回归不可能做到这一点),那么同一组内的观测之间 的误差可能相关; n这就违背了传统回归(OLS)中关于残差相互独立的 假设; n至少,传统回归分析得到的标准误的估计不正确(太 小)。 HLM数据特点 n对于嵌套数据,传统回归模型的做法: (1)个体(如学生)水平上分析 问题:同一班级的学生间相互独立的假 设是不合理的,同样对不同班级的学生 和相同班级的学生作同一假设也是不合 理的。 (2)组(如学校)水平上分析 问题:丢失了班级内学生个体间的差异 的信息。

4、HLM数据特点 n对于嵌套数据,传统回归分析的假设往 往无法满足。 传统的线性回归模型假设变量间存在直 线关系,因变量总体上服从正态分布, 方差齐性,个体间相互独立。前两个假 设较易保证,但方差齐性,尤其是个体 间相互独立的假设却很难满足。 独立性不满足带来的问题 n传统回归系数估计的标准误依赖于 相互独立的假设; n如果独立性的假设不满足,得到的 标准误的估计往往偏小,因此所犯 第一类错误的概率往往偏大。 表1 当组内相关存在时,第一类错误限定 为0.05时,实际所犯第一类错误的概率 组内相关 组样本容量0.010.050.20 100.060.110.28 250.080.190.46 5

5、00.110.300.59 1000.170.430.70 HLM数学模型 n例如:对73个学校1905名学生进行调查, 目的是考虑其刚上高中时的入学成绩与 三年后高考成绩之间的关系。 考虑方法: (1)如果用传统的线性回归分析,直接在 学生水平上进行分析,得出入学学业成 绩对高考成绩之间的一条回归直线,如 下图1所示,从图1的结果可以看出,传 统回归分析没有区分不同的学校之间的 差异。 图1:不考虑学校之间差异的回归直线 HLM数学模型 n(2)如果将数据进行简单合并,用每个学校 学生的平均成绩代替这个学校的成绩,直接在 学校水平上估计入学成绩对高考成绩的影响, 得到一条回归直线,如图2所示

6、,这种方法忽 略了不同学生之间的差异; 图2:只考虑学校差异忽略学生差异回归直线 HLM数学模型 n(3)如果假设不同学校入学成绩对 高考成绩的回归直线截距不同,斜 率相同(平均学习成绩之间存在差 异),得到如图3的结果,从图中结 果可以看出,不同学校学生平均高 考成绩之间存在差异。 图3:考虑不同学校平均成绩差异的回归直线 HLM数学模型 n(4)对73所学校分别做回归分析, 得到如图4的结果,如图4所示,从 图中结果可以看出,不同学校回归 直线的截距和斜率均不同,即:不 同学校学生平均高考成绩之间存在 差异,入学学业成绩对高考成绩的 影响强度不同。 图4:考虑不同学校平均成绩差异 和入学对

7、毕业成绩影 响程度差异的回归直线 回归模型中,如何解决残差相关 的问题? n希望定义一个模型,可以明确地允 许因变量水平在组内和组间存在差 异 n例如,允许学生的学业成绩存在学 校之间的差异 告别 OLS: 一个简单的多层线性模 型 n将 n重写为: 一个简单的多层线性模型 一个简单的多层线性模型 Outcome for observation i in unit j 一个简单的多层线性模型 Outcome for observation i in unit j Intercept 一个简单的多层线性模型 Outcome for observation i in unit j Intercep

8、t Coefficient Value of X for observation i in unit j 一个简单的多层线性模型 Outcome for observation i in unit j Intercept Coefficient Value of X for observation i in unit j Residual term specific to unit j 一个简单的多层线性模型 Outcome for observation i in unit j Intercept Coefficient Value of X for observation i in uni

9、t j Residual term specific to unit j Residual term specific to observation i in unit j 一个简单的多层线性模型 Outcome for observation i in unit j Intercept Coefficient Value of X for observation i in unit j Residual term specific to unit j Residual term specific to observation i in unit j uj表示什么? n残差项 n定义第 j 组

10、(第二水平) n对于第 j组的所有观测都相同 n只有下标 j, 没有下标 i n解释: 总截距和第 j组的截距之间的差异 rij表示什么? n残差项 n定义第 j 组第i 个观测 n均值为0 模型的特征 n注意到: ij = uj + rij n我们有: Var(ij)= Var(uj + rij) = Var(uj) + Var(rij) + 2*Cov(uj,rij) = Var(uj) + Var(rij) 模型的特征 n Yij 的值可能存在第二水平(组间)的差异 n对于 uj和 rij没有定义其分布. n X 和 Y 之间的关系不依赖于 j (1 不依赖于 j) 模型的另一种表达 这

11、里 多层线性模型 n水平1(如:学生) n水平2(如:学校) jj u 0000 += Yij-第j个 学校的第i 个学生 jj u 1101 += 何谓多层线性模型? n多层线性模型又称为: n多水平分析( Multilevel Analysis ) n混合模型(Mixed Models) n随机系数模型(Random Coefficient Models) HLM的发展 nHarvey Goldstein-Multilevel Analysis ( Mlwin) nStephen W. Raudenbush-Hierarchical Linear Model (HLM) HLM的发展 模型

12、理论构想阶段(Lindley Dempster(1981)将EM算法应用于 解决多层线性模型的参数估计 ; 1983年, Strenio、Weisberg和Bryk等相继将这一方 法应用于社会学的研究;1986年 Goldstein应用IRGLS估计参数,1987年, Longford应用费歇得分算法对模型参数进 行了估计。 HLM的发展 快速发展与应用 HLM(Bryk,Randenbush,Seltzer Congdon,1988); Mlwin(Rabash,ProsserGoldstein, 1989); VARCL(Longford,1988); MPLUS(Muthen,1992)

13、。 多层线性模型 n回归模型的一种 n常用来回答背景变量(如班级环境等)与个体 变量(如学生特征)之间的关系 n常用来估计组内(如班级内)和组间(如班级 间)变量间的关系 以及跨水平的交互作用。 n例如, 学校组织气氛对学生学业成绩的影响 ;学校组织气氛与学生社会经济地位的交互 作用。 多层线性模型简介 n多层线性模型一种处理嵌套数据的 统计方法。通过定义不同水平(层)的 模型,将随机变异分解为两个部分,其 一是第一水平个体间差异带来的误差, 另一个是第二水平班级的差异带来的误 差。可以假设第一水平个体间的测量误 差相互独立,第二水平班级带来的误差 在不同班级之间相互独立。多水平分析 法同时考

14、虑到不同水平的变异 。 多层线性模型 n多层分析方法提供了解决嵌套数据关系 的合理的正确的统计方法。下面结合上 面提到的例子,介绍两水平模型的一般 数学表示: 多层线性模型 n水平1(如:学生) n水平2(如:学校) jjj uW 001000 += Yij-第j个 学校的第i 个学生 多层线性模型 n合并模型: 其中:yij表示因变量(如三年后的 高考成绩),xij表示第一水平(学 生)的预测变量,Wj表示第二水平 (学校)的预测变量。 多层线性模型 n模型的假设条件为: 多层线性模型 截距与斜率之间的相关系数: n截距与斜率之间的相关系数大小表示了不同学 校平均高考成绩与入学成绩对高考成绩

15、影响强 度之间的关系,如果相关系数大于零,表示平 均成绩越高,入学成绩对期末成绩的影响越大 。 HLM常用模型类型 n随机效应一元方差分析模型(one-way Anova with Random Effect) 第一水平: 第二水平: 合并模型: ijojij euY+= 00 HLM常用模型类型 n无条件模型:模型中没任何预测变量的多层分 析模型; 模型表示与随机效应的方差分析模型 相同。在无条件模型中: 上式的相关系数描述了水平2单位内个体之间 的相关(intra level 2-unit correlation),它测量 了学校之间方差占总方差的比例,或者说在总 的变异中由水平二解释的方差的比例。 HLM常用模型类型 n随机效应单因素协方差分析(One-way ANCOVA with Random Effects) 水平1: 水平2: HLM常用模型类型 n一般的线性回归模型 n第一水平 : n第二水平: HLM常用模型类型 n随机系数回归模型(Random-Coefficients Regression Model) 第一水平 : 第二水平: HLM应用举例 nhsb1.sav和hsb2.sav 在水平一的数据文件hsb1.sav中,有7185个观测 样本和四个第一水平的变量(不包含第二水平 指标变量:学校编号ID),这四个变量所表示 的含义如下: minorit

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号