纵向数据分析方法

上传人:kms****20 文档编号:46602445 上传时间:2018-06-27 格式:PDF 页数:7 大小:977.61KB
返回 下载 相关 举报
纵向数据分析方法_第1页
第1页 / 共7页
纵向数据分析方法_第2页
第2页 / 共7页
纵向数据分析方法_第3页
第3页 / 共7页
纵向数据分析方法_第4页
第4页 / 共7页
纵向数据分析方法_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《纵向数据分析方法》由会员分享,可在线阅读,更多相关《纵向数据分析方法(7页珍藏版)》请在金锄头文库上搜索。

1、心理科学进展 2003,11(5) :586592 Advances in Psychological Science 纵向数据分析方法 刘红云 孟庆茂 (北京师范大学心理学院,北京 100875) 摘 要 纵向研究方法是心理学研究领域的一种重要方法。近年来,国外在纵向研究数据分析方法上取得了一系列理论和应用上的进展。文章对此方法进行了简要的回顾,并重点阐述了最近发展起来的纵向研究的方法:多层线性模型和潜变量增长曲线模型,并在此基础上对几种常用的方法进行了比较。 关键词 纵向研究,多层线性模型,潜变量增长曲线模型。. 分类号 B841 1 引 言 纵向研究在心理学中处于特殊的地位,这一研究主要

2、用来分析一段时间或某几个时间点总体的平均增长趋势和个体之间的差异。也就是说,对于纵向研究设计,主要关心两个问题,一个是描述总体的平均增长趋势,另一个是用来描述不同个体之间增长趋势的差异。纵向研究与横向研究相比,最大的优点是纵向研究设计可以合理地推论变量之间存在的因果关系。从方法论的角度讲,要想得出变量之间的因果关系,原因变量和结果变量之间至少要满足下列 3 个条件1: (1)假设存在因果关系的原因变量和结果变量之间是相关的; (2)从时间上来讲,原因变量在前,结果变量在后; (3)在所考虑的模型中,其他原因变量对结果变量的影响能够被控制或排除。可见从方法论的角度来讲,横向研究永远不可能满足上述

3、的第二个条件,所以要从横向研究数据本身探索变量之间的因果关系,几乎是不可能的。正是由于纵向研究有这一显著优点,所以在心理研究中,多用纵向研究探讨数据之间的因果关系和分析事物的增长规律。 近年来,随着社会科学研究方法的快速发展,提供了一系列分析变量增长趋势的统计方法。其中概括起来,主要有以下几种:(1)重复测量的方差分析(repeated measures analysis of variance);(2)时间序列分析 (time series analysis);(3)潜变量增长曲线模型 (latent growth curve model);(4)多层线性模型 (hierarchical l

4、inear model)。 上面常用的几种方法各有优缺点,前面两种方法主要是解决总体平均发展趋势的问题,而后两种方法除了对总体平均增长趋势进行分析外,同时注重个体发展趋势之间的差异。因此,从心理学纵向研究方法的进展而言,纵向研究的问题,逐渐由以往的注重总体平均趋势的发展过渡到综合考虑总体平均趋势和个体发展差异的系统分析的问题2。 2 传统纵向数据分析方法综述 2. 重复测量方差分析 重复测量的方差分析在实际中有非常广泛的应用, 其中的一个作用就是用来分析重复测量实验设计 (又称被试内设计、混合设计等)得来的数据。该方法通过把总的变异分解为被试内和被试间两部分,对被试收稿日期:2002-08-3

5、0 通讯作者:刘红云,E-mail: ,电话:010-62205168 586 第 11 卷第 5 期 纵向数据分析方法 -587- 的平均增长趋势进行分析,可以通过多项式比较分析线性增长趋势和非线性增长趋势。如果研究中我们只关心不同时间点的平均数间是否存在差异,可以用单变量方差分析解决这一问题。但是值得注意的是应用重复测量的方差分析时,必须满足协方差矩阵球形(sphericity)的假设条件,也就是说,MANOVA 要求所有重复测量的总体的方差相等并且所有重复测量总体之间的协方差也相等。如这一条件不满足,那么得到的 F 检验统计量的值正偏,拒绝虚无假设的概率增大,也就是说如果观测变量协方差矩

6、阵球形假设条件不满足,传统重复测量的方差分析的统计检验力降低,F 检验犯第一类错误的概率增大。另外,MANOVA 不能用来处理依时间变化的协变量对因变量的影响。关于重复测量方差分析的详细介绍在大多数的统计资料中都有较详细的介绍,这里不再重复。 用于重复测量的方差分析的软件有很多,最基本的有 SAS、SPSS 和 Statistics 等,另外,这一方法还可看成是后面介绍的 LGM 和 HLM 的特例,也可用 SEM 和 HLM 软件进行分析。 2. 时间序列分析 时间序列分析是对纵向研究数据进行分析的另外一类非常重要的统计分析技术,它在许多领域都有十分重要的应用,尤其在预测和控制应用方面,有着

7、其它方法不可比拟的优点。时间序列分析以回归分析为基础,目的在于测定时间序列中存在的长期趋势、季节性变动、循环波动及不规则变动,并进行统计预测。为了对时间序列中不同的变化趋势进行分析,主要有两大类模型:经典模型(Kinetic Model)和动态模型(Dynamical Model) ,经典模型是将时间序列xt, tT看作是时间的函数:x t=f(t);而动态模型是将 t 时刻的观测看成是 t 时刻前观测值(可以与 t 时刻的观测类型相同,也可以不同)的函数:x t=f(x t-1 ,x t-2,),通常所说的 AR,ARMA,ARMIA 模型都属于这一类,这里为了便于和其他几种方法比较,我们只

8、简单介绍第一种类型模型。对于第一种类型的模型常用的模型有:加法模型,即假定各构成部分对时间序列的影响是相互独立的,这时可以将时间序列表示为:ISCTxt+=,其中,T、S、C、I 分别代表时间序列中存在的长期趋势、季节性变动、循环波动及不规则变动。另一类是乘法模型,即假设各组成部分对时间序列的影响均按比例变化,从而可以把时间序列表示为:ISCTxt=。除上面的加法模型和乘法模型外,还有其它混合模型,不再一一列举。进行时间序列分析,如果我们要测定长期趋势(可以是直线的也可以是非直线的) , 可以通过移动平均法、 时距扩大法或数学模型法, 剔除时间序列中循环波动 C、季节性变动 S 及不规则变动

9、I,使得时间序列的长期增长趋势显现出来。 对于时间序列中的第二类模型,在实际中有许多应用,模型分类也比较复杂,需要对时间序列的平稳性进行分析,并且要求研究者有较高的数学素养。另外,由于时间序列分析往往要求较多的连续观测时间点,所以在心理学和教育学中用的不是很多。 目前常用的统计软件 SAS、SPSS 和 BMDP 都含有时间序列分析过程,可以对常见的几种时间序列模型进行统计分析。 3 纵向数据分析方法新进展 3.1 潜变量增长曲线模型 潜变量增长曲线模型是用于固定情形(fixed occasion)纵向研究数据的一种统计分析方法,也就是说,该方法适用于在某几个固定时间点观测得来的纵向研究资料。

10、在潜变量增长曲线模型中,用潜变量来描述总体的平均增长趋势和依时间变化的情况3,4。基本模型可以用下图表示(图 1): 图 1 描述的是含有五个测试时间点的潜变量增长模型,y1i,y2i,y3i,y4i,y5i分别表示第 i 个被试的 5 次测量结果,上述模型可以表示为: -588- 心理科学进展 2003 年 titiiitieTy+=10 ; 5 , 4 , 3 , 2 , 1=ini,2 , 1 = (1) iiiuZ001000+= (2) iiiuZ111101+= (3) 其中i0,i1分别表示截距和斜率,在上面的模型中,这一截距和斜率为随机参数, (2)和(3)进一步解释上述截距i

11、0和斜率i1的变化。 图 1 潜变量增长模型结构图 从上面模型的描述可以看出潜变量增长曲线模型同时考虑因素的平均值和方差,也就是说,潜变量增长曲线模型不仅分析了总体的发展趋势,而且可以分析总体之间存在的差异。 事实上,在上述的潜变量模型中,只是简单地定义了线性增长模型,在实际中,我们可以不固定斜率测量的因素载荷(如在图 1 中让固定为 2,3,4 的斜率载荷自由估计)得到增长曲线模型,我们还可以定义测量误差之间的不同关系(如限定测量误差相等,误差间存在一阶自相关,二阶自相关等等) 。有关潜变量增长曲线的更详细的和深入的介绍,可以参看 Duncan 的著作1。 潜变量增长曲线模型可以用协方差结构

12、模型(SEM)软件进行分析,常用的软件有 Lisrel3, AMOS5, EQS6 和 MPLUS7等。 32 多层线性模型 多层线性模型是用于分析具有嵌套结构特点数据的一种统计分析技术,近年来在教育、管理等领域有相当广泛的应用。当对相同的观测对象进行重复测量时,可以将这些重复测量的数据本身看成是具有嵌套结构特点的。如对生长发育期儿童身高和体重变化情况的追踪调查等,可将这些重复测量数据构造出一个两水平的层次结构,其重复测量或测量点为水平 1 的单位,观测个体为水平 2 的单位8,这时就可用多层分析的方法对纵向数据进行分析。 对于重复测量的数据,用层次分析法描述数据之间的关系,对应的两水平重复测

13、量模型,可以用下式表示(下面只给出最简单的一种多层模型形式,实际上,可以进一步考虑更多的不同水平预测变量和更复杂的随机残差之间的关系) : 水平 1(重复测量) :YtitiiitieT +=10 水平 2(个体) : iiiuZ001000+= iiiuZ111101+= 合并模型可以表示为:YtitiiitiiititieTuuTZZT+=1011011000 第 11 卷第 5 期 纵向数据分析方法 -589- 从上面的模型中可以看出,与潜变量增长曲线模型类似,多层分析不仅可以分析总体上个体随时间的变化(截距 00和斜率 10) ,而且可以将个体之间增长的差异进行分析(截距的差异u,斜率

14、的差异) ,并将这一差异的原因进行解释(i0iu101解释截距的差异和 11解释斜率的差异) 。 可以在上述模型中包含更多的水平 1 的随机误差。这主要是由于在重复测量的模型,测量与测量之间往往是相关的而不是独立的(如在个体水平上的多次测量,由于具有相同的个体特征和测量间的相互影响,存在的测量误差(第一水平的随机误差)之间的“自相关” ) 。 对于多层线性模型的数据分析,可以采用专门的软件进行分析,常用的用于多层分析的统计分析软件有:HLM8,MLn9 ,VARCL10,SAS 和 Mplus7等。 33 应用举例 为了使读者对这两种方法有一个初步的认识,下面通过一个简单的例子来说明多层线性模

15、型和潜变量增长曲线模型在分析纵向研究数据时的应用。 数据:随机抽取 155 名婴儿,测量其出生时的体重,然后在婴儿 3 个月,9 个月,15 个月和 21 个月每隔半年测量一次体重,目的在于分析婴儿 2 岁以前体重的增长情况,以及出生时的体重对婴儿体重的影响。 对于上面的问题,我们可以用传统的协方差分析(出生时的体重为协变量) ,对平均体重增长的情况进行分析,这里我们不再重复这一传统分析方法的结果。主要就多层线性模型和潜变量增长曲线模型在分析这类数据时的应用进行简单介绍。我们首先假设简单的线性增长模型,对于多层线性模型和潜变量增长模型分别用 HLM 和 Lisrel 对上面的数据进行分析,得到结果如下(见表 1) 。 表 1 多层线性模型和潜变量增长模型参数估计结果 多层线性模型 潜变量增

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号