《多水平统计模型简介SPSS操作优质借鉴》由会员分享,可在线阅读,更多相关《多水平统计模型简介SPSS操作优质借鉴(52页珍藏版)》请在金锄头文库上搜索。
1、Chongqing Medical University Peng Bin多水平模型简介多水平模型简介Multilevel Models优质材料单水平模型单水平模型1,2,.,i,.n个观察对象模型假设: 正态性、独立性、残差方差齐同性 协变量的影响保持不变2优质材料Chongqing Medical University Peng Bin假设不满足时的处理假设不满足时的处理1.正态性不满足 数据变换,增加样本含量2.方差非齐性 增加协变量 数据变换 广义线性模型或非线性模型3.独立性不满足 S.E.的稳健估计 GEE估计方法 拟合非独立性来源的拟合非独立性来源的模型模型优质材料Chongqi
2、ng Medical University Peng Bin非独立性来源非独立性来源1.区域环境对反应变量的影响 卫生服务区域的资源、社会经济条件和政策会影响对病人的服务质量 高血压发病率可能有地区聚集性,取决于经济文化背景和居民饮食习惯2.重复测量结果通常具有强相关 分子生物学研究中重复测量数据处理中的问题3.区组设计和多中心试验 卫生毒理实验研究中同窝动物的相似性 同中心内病人病情、病种相似性优质材料 两水平层次结构数据两水平层次结构数据水平2 水平1 层次结构数据的普遍性层次结构数据的普遍性子女子女学生学生两水平层次结构:水平1单位在水平2内聚集测量测量1 1测量测量2 2测量测量3 3
3、5优质材料Chongqing Medical University Peng Bin 层层次次结结构构数数据据为为一一种种非非独独立立数数据据,即即某某观观察察值值在在观观察察单单位位间间或或同同一一观观察察单单位位的的各各次次观观察察间间不不独独立立或或不不完完全全独独立立,其其大大小小常常用用组组内内相相关关(intra-class correlation,ICC)度量。度量。 例例如如,来来自自同同一一家家庭庭的的子子女女,其其生生理理和和心心理理特特征征较较从从一一般般总总体体中中随随机机抽抽取取的的个个体体趋趋向向于于更更为为相相似似,即即子子女女特特征征在在家家庭庭中中具具有有相相
4、似似性性或或聚聚集集性性(clustering),数据是非独立的,数据是非独立的(non independent)。优质材料Chongqing Medical University Peng Bin忽略多水平层次结构的后果忽略多水平层次结构的后果1.模型中的参数估计值、标准误有偏差2.残差方差偏大,即模型拟合优度差3.损失高水平(如水平二:学校)对结果的影响信息优质材料经经典典模模型型的的基基本本假假定定是是单单一一水水平平和和单单一一的的随随机机误误差差项项,并并假假定定随随机机误误差差项项独独立立、服服从从方方差差为为常常量量的的正正态态分分布布,代代表表不不能能用用模模型型解解释释的的残
5、残留留的随机成份的随机成份多多水水平平模模型型将将单单一一的的随随机机误误差差项项分分解解到到与与数数据据层层次次结结构构相相应应的的各各水水平平上上,具具有有多多个个随随机机误误差差项并估计相应的残差方差及协方差。项并估计相应的残差方差及协方差。构构建建与与数数据据层层次次结结构构相相适适应应的的复复杂杂误误差差结结构构,是多水平模型区别于经典模型的根本特征是多水平模型区别于经典模型的根本特征多多水水平平模模型型由由固固定定与与随随机机两两部部分分构构成成,其其随随机机部分可以包含解释变量部分可以包含解释变量基本的多水平模型基本的多水平模型 8优质材料 假假定定一一个个两两水水平平的的层层次
6、次结结构构数数据据,学学校校为为水水平平 2 单单位位,学学生生为为水水平平 1 单单位位,学学校校为为相相应应总总体体的的随机样本。随机样本。多水平模型基本结构多水平模型基本结构学校1学生学生学校k学生学生观测指标:观测指标: X, Y9优质材料Chongqing Medical University Peng Bin普通线性回归,忽略学校普通线性回归,忽略学校优质材料Chongqing Medical University Peng Bin按学校分别拟合按学校分别拟合截距不同,斜率相同截距相同,斜率不同截距不同,斜率不同优质材料Chongqing Medical University Pe
7、ng Bin按学校绘制散点图及拟合线该模型即为多水平模型优质材料Chongqing Medical University Peng Bin和和 分别为第分别为第 j 个个学校中第学校中第 i 个学生应变量个学生应变量观测值和解释变量观测值观测值和解释变量观测值多水平模型基本结构多水平模型基本结构优质材料Chongqing Medical University Peng Bin多水平模型基本结构多水平模型基本结构固定效应部分随机效应部分(残差项)优质材料Chongqing Medical University Peng Bin为为平平均均截截距距,反反映映 与与 的的平平均均关关系系,即当即当
8、x 取取 0 时,所有时,所有 y 的总平均估计值。的总平均估计值。 为为随随机机变变量量,表表示示第第 j 个个学学校校 y 的的平平均均估估计计值值与与总总均均数数的的离离差差值值,反反映映了了第第 j 个个学学校校对对 y 的的随机效应。随机效应。优质材料Chongqing Medical University Peng Bin 表表示示协协变变量量 x 在在所所有有学学校校的的平平均均效效应应估估计计值值(固固定定部部分分), 表表示示协协变变量量 x 在在不不同同学学校校所所产产生生的的特特殊殊效效应应(随随机机部部分分),反反映映协协变变量量与与学学校校之之间间产产生生的的交交互互
9、效效应应,即即学学校校间间 y 的的变变异异与与协协变量变量 x 的变化有关。的变化有关。优质材料 反反应应变变量量Y可可表表达达为为固固定定部部分分 与与随随机机部部分分 之之和和。模模型型具具有有多多个个残残差差项项,这是多水平模型区别于经典模型的关键部分。这是多水平模型区别于经典模型的关键部分。此此模模型型需需估估计计5个个参参数数,除除两两个个固固定定系系数数 和和 ,还还需需估估计计三三个个随随机机参参数数 和和 。其其中中 即即为学校水平的方差成份,为学校水平的方差成份, 为学生水平的方差成份。为学生水平的方差成份。17优质材料几种常见类型几种常见类型方差成分模型方差成分模型 (V
10、ariance Component Model)随机系数模型随机系数模型(Random Coefficient Model)18优质材料方差成分模型方差成分模型 只是将反应变量只是将反应变量Y分解为个体差异部分和组(层)差分解为个体差异部分和组(层)差异部分。水平异部分。水平1和水平和水平2都没有预测量变,即零模型都没有预测量变,即零模型(Null Model)或空模型()或空模型(Empty Model)只包含固定效应的协变量只包含固定效应的协变量最简单的多水平模型最简单的多水平模型19优质材料Chongqing Medical University Peng Bin组内相关的度量组内相关的
11、度量应变量方差为(可含固定效应协变量)应变量方差为(可含固定效应协变量)此即水平此即水平 2 和水平和水平 1 方差之和。方差之和。同一学校中两学生同一学校中两学生(用用i1,i2 表示表示)间的协方差为:间的协方差为:优质材料Chongqing Medical University Peng Bin组内相关组内相关(intra-class correlation, ICC) ICC测测量量了了学学校校间间方方差差占占总总方方差差的的比比例例,实实际际上上它它反反映映了了学学校校内内个个体体间间相相关关,即即水水平平 1 单单位位(学学生生)在在水水平平 2 单单位位(学学校校)中中的的聚聚集
12、集性性或或相似性。相似性。优质材料Chongqing Medical University Peng Bin 由由于于模模型型不不止止一一个个残残差差项项,就就产产生生了了非非零零的的组组内内相相关关。若若 为为 0,表表明明数数据据不不具具层层次次结结构构,可可忽忽略略学学校校的的存存在在,即即简简化化为为传传统统的的单单水水平平模模型型;反反之之,若若存存在在非非零零的的 ,则不能忽略学校的存在。则不能忽略学校的存在。优质材料Chongqing Medical University Peng Bin随随机机系系数数模模型型是是指指协协变变量量的的系系数数估估计计不不是是固固定定的的而而是是
13、随随机机的的,即即协协变变量量对对反反应应变变量量的效应在不同的水平的效应在不同的水平2 2单位间是不同的。单位间是不同的。仍仍以以学学校校与与学学生生两两水水平平数数据据结结构构说说明明随随机系数模型基本结构与假设。机系数模型基本结构与假设。随机系数模型随机系数模型(Random Coefficient (Random Coefficient Model)Model)优质材料 方差成份模型中协变量方差成份模型中协变量 的系数估计为固定的的系数估计为固定的 ,表示示协变量,表示示协变量 对反应变量的效应是固定不变的。对反应变量的效应是固定不变的。在随机系数模型中协变量在随机系数模型中协变量 的
14、系数估计为的系数估计为 ,示,示每个学校都有其自身的斜率估计,表明协变量每个学校都有其自身的斜率估计,表明协变量 对对反应变量的效应在各个学校间是不同的。反应变量的效应在各个学校间是不同的。随机系数模型基本形式随机系数模型基本形式第一层:第一层:第二层:第二层:24优质材料 表表示示第第 j 个个学学校校的的 y 随随 x 变变化化的的斜斜率率; 表表示示全全部部学学校校的的 y 随随 x 变变化化的的斜斜率率的平均值的平均值(平均斜率平均斜率)。 是是指指各各学学校校的的 y 随随 x 变变化化的的斜斜率率 的方差。的方差。25优质材料 模模型型为为固固定定部部分分与与随随机机部部分分之之和
15、和。其其中中,固固定定效效应应用用均均数数描描述述,它它决决定定了了全全部部学学校校的的平平均均回回归归线线,这这条条直直线线的的截截距距即即平平均均截截距距 ,直直线线的的斜斜率率即即平平均均斜斜率率 。 为随机系数。为随机系数。将模型改记为:将模型改记为: 随随机机效效应应用用方方差差描描述述,它它反反映映了了各各学学校校之之间间 y y 的的变变异异与与协协变变量量 x x 的的关关系系。模模型型随随机机部部分分具具多多个个残差项,需估计残差项,需估计3 3个随机参数,即方差个随机参数,即方差 、 、 。26优质材料 为第二层的解释变量(可包含多个),可以在零为第二层的解释变量(可包含多
16、个),可以在零模型与完整模型之间,根据研究目的,设置不同的随模型与完整模型之间,根据研究目的,设置不同的随机成分和固定成分,构建一系列分析模型。机成分和固定成分,构建一系列分析模型。完整模型(水平完整模型(水平1 1和水平和水平2 2上均有解释变量)上均有解释变量)第一层:第一层:第二层:第二层:27优质材料Chongqing Medical University Peng Bin 反应变量向量的协方差结构反应变量向量的协方差结构从从最最基基本本的的两两水水平平数数据据结结构构来来考考察察反反应应变变量量向向量的协方差结构(零模型或方差成分模型)量的协方差结构(零模型或方差成分模型)即只包括随
17、机参数即只包括随机参数 和和 。对对应应于于方方差差成成分分模模型型,反反应应变变量量方方差差为为水水平平 1 和水平和水平 2 方差之和:方差之和:优质材料同一个学校的两个学生同一个学校的两个学生(用用 , 表示表示)间间的协方差为:的协方差为:因此,同一学校三名学生的协差阵为因此,同一学校三名学生的协差阵为29优质材料两两个个学学校校,若若一一个个学学校校抽抽取取了了三三名名学学生生,另另一一个个学学校校抽抽取取了了两两名名学学生生,则则具具有有 2 个个水水平平 2 单单位位(学学校校)的的反反应应变变量量向向量量 Y 总总的的协协差差阵阵可可表表达达为为(总总共共5名名学学生生),不不
18、同同学学校校学学生生之之间间协协方方差为差为0。容易扩展到多个学校的情形。容易扩展到多个学校的情形。0030优质材料Chongqing Medical University Peng Bin固定与随机参数估计方法固定与随机参数估计方法最大似然估计最大似然估计(Maximum Likelihood,ML)基于普通残差项基于普通残差项限制性最大似然估计限制性最大似然估计(Restricted Maximum Likelihood,REML)基于全残差项,即包含所有的随机变异基于全残差项,即包含所有的随机变异SAS、SPSS默认采用默认采用REML优质材料Chongqing Medical Univ
19、ersity Peng Bin1. 重复测量数据的多水平模型重复测量数据的多水平模型复复测测量量时时,测测量量点点为为水水平平 1 单单位位,研研究究对对象象作作为为水水平平 2 单单位,具有典型的层次结构特征。位,具有典型的层次结构特征。采用多水平模型的具有如下特点:采用多水平模型的具有如下特点:可估计不同层次的测量误差;可估计不同层次的测量误差;不要求相等的时间间隔,拟合个体生长曲线及平均生长曲线不要求相等的时间间隔,拟合个体生长曲线及平均生长曲线测量点个数可不相等,即允许存在缺失测量点个数可不相等,即允许存在缺失可引入解释变量可引入解释变量 多水平模型的应用多水平模型的应用优质材料Cho
20、ngqing Medical University Peng Bin2. Meta分析可视为两水平的层次结构分析可视为两水平的层次结构Meta分分析析主主要要根根据据“效效应应尺尺度度”的的同同质质性性检检验验结结果果,而而决决定定采采用用固固定定效效应应模模型型或或随随机机效效应应模模型型来来合合并并每每项项研研究究的的“效效应尺度应尺度”。视视为为研研究究水水平平与与个个体体水水平平的的两两水水平平结结构构,采采用用多多水水平平模模型型可可分分析析影影响响研研究究结结果果间间差差异异的的因因素素,如如研研究究水水平平上上的的有有关关协协变变量,包括样本含量、设计类型等量,包括样本含量、设计
21、类型等优质材料Chongqing Medical University Peng Bin3. 空间变异的多水平模型空间变异的多水平模型疾病发生在空间上的变异:个体为水平疾病发生在空间上的变异:个体为水平 1,地区为水平,地区为水平 2例例如如,若若干干地地区区某某时时期期的的死死亡亡记记录录、死死者者个个人人特特征征、地地区区特特征征等等,可可以以分分析析这这些些解解释释变变量量是是否否能能够够解解释释死死亡亡率率在在地地区区之之间的变异,也可以分析死亡率的差别是否在地区之间不同等间的变异,也可以分析死亡率的差别是否在地区之间不同等优质材料Chongqing Medical Universit
22、y Peng Bin4. 多变量多水平模型多变量多水平模型在在医医学学研研究究中中,研研究究者者常常对对个个体体作作几几种种测测量量( (即即测测量量几几个个指指标标) ),如如收收缩缩压压、舒舒张张压压和和心心率率,如如果果将将它它们们作作为为反反应应变变量量一一起起进进行行分分析析,就就可可以以设设置置多多变变量量模模型型,分分析析解解释释变变量量诸诸如如年年龄龄、性性别别、是是否否锻锻炼炼、是是否否吸吸烟烟等等与与这这三三个个反反应应变变量量的的关关系系。此此时时,是是将将其其作作为为一一个个两两水水平平模模型型,每每一一个个体体作作为为一一个个水平水平2 2单位,单位,3 3种测量组成
23、水平种测量组成水平1 1单位。单位。优质材料Chongqing Medical University Peng Bin实例一项初级学校项目(Junior School Project)的部分数据,包含了London65所初级中学共4059名学生的数据,有如下变量:School: 学生所在学校代码Student:学生IDExam16:16岁时考试成绩(标化)Exam11:11岁时考试成绩(标化)Gender:性别,0男生,1女生TypeSch:学校类型,1混合,2男校,3女校Avexam:各学校11岁时的平均分(标化)优质材料Chongqing Medical University Peng B
24、in两层结构模型1:无解释变量学校1学生学生学校k学生学生观测指标:观测指标: X, Y水平2水平1优质材料Chongqing Medical University Peng BinSPSS操作AnalyzeMixed ModelsLinear12优质材料Chongqing Medical University Peng BinRandom34Statistics5OK优质材料Chongqing Medical University Peng Bin模型1结果反映学校差异的估计值为0.171598,具有统计学意义,不同学校教学水平有差异优质材料Chongqing Medical Univers
25、ity Peng Bin模型模型2入学成绩(11岁时)可能对16岁的成绩有影响,纳入Exam11,拟合如下模型即入学成绩Exam11同时作为固定因子和随机因子优质材料Chongqing Medical University Peng BinSPSS操作AnalyzeMixed ModelsLinear12优质材料Chongqing Medical University Peng BinFixedRandom34优质材料Chongqing Medical University Peng Bin5Statistics6OK优质材料Chongqing Medical University Peng
26、Bin模型2结果固定效应:对Exam11固定效应进行检验,P=0.000,说明入学成绩对16岁成绩有影响对Exam11随机效应进行检验,P=0.001,说明入学成绩对校内成绩变异有影响,即不同11岁成绩,16岁成绩离散度不相同。优质材料Chongqing Medical University Peng Bin模型模型3入学成绩(11岁时)、性别、学校平均入学成绩可能对16岁的成绩有影响,纳入Exam11,拟合如下模型优质材料Chongqing Medical University Peng BinSPSS操作AnalyzeMixed ModelsLinear12优质材料Chongqing Me
27、dical University Peng BinFixedRandom34优质材料Chongqing Medical University Peng Bin5Statistics6OK优质材料Chongqing Medical University Peng Bin模型3结果固定效应:对固定效应进行检验,除截距项外均P0.05,说明入学成绩、性别、学校入学平均成绩对16岁成绩都有影响。性别为哑变量,为男生相对于女生的成绩,-0.170505说明男生比女生成绩低。优质材料Chongqing Medical University Peng Bin模型3结果对随机效应进行检验,由于没有纳入新的随机变量,各估计值变化不大。优质材料Chongqing Medical University Peng Bin谢谢优质材料