基于随机系数模型的重复测量资料分析方法

上传人:kms****20 文档编号:46676674 上传时间:2018-06-27 格式:PDF 页数:4 大小:189.37KB
返回 下载 相关 举报
基于随机系数模型的重复测量资料分析方法_第1页
第1页 / 共4页
基于随机系数模型的重复测量资料分析方法_第2页
第2页 / 共4页
基于随机系数模型的重复测量资料分析方法_第3页
第3页 / 共4页
基于随机系数模型的重复测量资料分析方法_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于随机系数模型的重复测量资料分析方法》由会员分享,可在线阅读,更多相关《基于随机系数模型的重复测量资料分析方法(4页珍藏版)》请在金锄头文库上搜索。

1、3 基金项目:温州市科技局(编号:Y20070063) ;温州医学院科研发展基 金(编号:XNK07096)资助。11 温州医学院环境与公共卫生学院预防医学系(325035)21 浙江大学医学院流行病与卫生统计学教研室基于随机系数模型的重复测量资料分析方法3施红英1 沈 毅2【提 要】 目的 探讨随机系数模型在重复测量资料分析中的应用。方法 以实例说明随机系数模型,包括线性随 机系数模型和多项式随机系数模型在重复测量资料中的应用,并与重复测量方差分析进行比较。结果 重复测量方差分 析结果显示,处理因素无统计学意义,时间因素有统计学意义;随机系数模型拟合结果还提示因变量与时间之间可能存在 非线性

2、关系。结论 随机系数模型拟合结果基本与重复测量方差分析结论一致,但随机系数模型可以考虑资料的相关 性、 非线性问题,因此更为准确可信。 【关键词】 随机系数模型 重复测量 混合模型重复测量资料是对同一受试者的某项观察指标进 行多次观测得到的资料。由于在同一受试者的多次观 测值之间往往存在某种相关性,用通常的统计方法不能充分揭示出其内在的特点,有时甚至会得出错误的 结论1。因此,有关重复测量资料的分析方法成为近 代统计学研究的热点之一。目前,混合模型(包括协方 差类型模型、 随机系数模型)是新兴的分析重复测量资 料的一种强有力的统计方法2。笔者曾对协方差类型模型在重复测量资料分析中的应用进行了探

3、讨3。本文就随机系数模型做一探讨。原理简介随机系数模型是针对重复测量资料的又一种重要 建模方法,该模型可以描述观测值随时间变化的算术关系。最常见的是应用于观测值随时间变化呈线性关 系的情况。此时,要解决的首要问题就是比较不同处 理组各观测值随时间变化的速度是否相同。为解决该 问题,一个非常简单的方法就是把时间效应(time)作 为定量变量(注意,此处不是作为定性变量)引入模型,当作协变量来处理。此时的模型可以简单地表示为:yij=+ bpre + treatk+ mtimeij+ eij其中, timeij是第i个病人的第j次观测的时间, m 是一个常数,代表每个单位时间内观测值y的变化。 因

4、 此,就可以得到时间time的斜率m ,它描述了观测值 和时间之间的线性关系。 由于考虑到各个病人之间的 这种线性关系很可能存在变异,可以拟合病人效应以提供每个病人的截距项,同时拟合病人 时间交互效 应以提供每个病人的斜率。 模型如下:yij=+ bpre + treatk+ pi+ mtimeij+( pm)itimeij+ eij其中, ( pm)i是第i个病人斜率与平均斜率的差别; pi是第i个病人的截距与平均截距之差。 由于假定病人效应和病人 时间交互效应来自某种分布是合 情合理的,因此,可以将病人效应和病人 时间交互效应均拟合为随机效应,但是由于此处的随机效应涉 及协变量即时间变量(

5、 time) ,与一般的随机效应模型不同。因此,称这类模型为随机系数模型(random co2efficients models) ,该模型构成了混合模型的第三大类。可以简单地这么理解:其中随机效应是连续性变量的混合模型是随机系数模型,而随机效应是分类变量的混合模型是随机效应模型。 在拟合线性随机系数模型时,我们希望拟合固定效应以代表反应变量随时间的平均变化速度,通过拟 合处理 时间交互效应估计不同处理组变化速度的差异,同时,我们还需要固定效应代表每个处理组的截距。除了用固定效应代表平均斜率和截距之外,随机系数模型还允许每个受试者之间的斜率和截距存在随 机变异,使得针对每个受试者均有一条回归线

6、。这可以通过拟合受试者效应为随机效应,使得截距变异;而 拟合受试者 时间交互效应为随机效应,使得斜率变异。这些效应又用于计算时间效应和处理 时间交互 效应的标准误,从而对这两个效应进行估计,而这正是分析的主要目的。因此,随机系数模型中,基本模型包 括:固定效应:time、treat、treattime ,随机效应: pa2tient、patient2time。另外,其他一些受试者因素如年 龄、 性别以及这些因素与时间的交互作用等也可以引入模型。实例分析本文以某次临床试验中的观察指标 丙氨酸氨基转移酶为例,说明随机系数模型在重复测量资料分析中的应用。由于该指标不满足正态性的前提,所以先进行了对数

7、变换处理,转换成正态分布。 首先对该资料进行概貌分析,了解不同处理组的742 中国卫生统计2008年6月第25卷第3期反应变量平均值随时间变化的特点,见表1。表1 两组受试者各时间点的丙氨酸氨基转移酶(AL T)平均值TREATnmday0mday15mday30mday45a722. 148941. 750151. 631471. 57946b722. 156521. 832641. 775951. 66258随着时间的推移,两处理组丙氨酸氨基转移酶AL T的变化均呈下降趋势,但是a组下降更快,且在30天时两组相差最大。 第二,采用重复测量方差分析(repeated measuresanal

8、ysis of variance ,RMAOV) ,结果表明,时间 处理交互效应无统计学意义,P= 012763 ;处理效应也无统 计学意义,P= 010961 ,表明两处理组之间无差别;时 间效应具有统计学意义,P 010001 ,表明各个时间点 上丙氨酸氨基转移酶AL T的水平是有差异的。 第三,随机系数模型的拟合。此时数据集结构转换成表2形式,注意与重复测量资料的方差分析时的 数据集结构有所不同。表2 数据集格式PatientObsTREATCENTERtimey11a311.7993412a321.8451013a331.5440714a341.60206144573a111.4471

9、6144574a121.89763144575a131.56820144576a141.14613首先进行线性随机系数模型的拟合,其中,固定效 应包括:time、treat以及treat - time ,而随机系数包括:patient以及patient - time。结果如表35所示。表3 固定效应的解EffectEstimate Standard ErrorDFtPIntercept-2. 26520. 0571413839. 64 0. 0001TREATa- 0. 009700. 08037135- 0. 120. 9042TREATb0.Time- 0. 15960. 02003117

10、- 7. 97 0. 0001TimeTREATa- 0. 030820. 02778112- 1. 110. 2696TimeTREATb0.表4 固定效应的3型假设检验EffectNum DFDen DFFPTREAT11350. 010. 9042Time1112158. 81 0. 0001TimeTREAT11121. 230. 2696表5 拟合多项式随机系数模型时的数据集结构PatientObsTREAT CENTERtimeytime2time311a311. 799341112a321. 845104813a331. 5440792714a341. 602061664 144

11、573a211. 4471611144574a221. 8976348144575a231. 56820927144576a241. 146131664由线性随机系数模型拟合结果可知,时间 处理 交互效应无统计学意义,P= 012696 ,说明两个处理组 的丙氨酸氨基转移酶随时间的下降速度差别没有统计 学意义。处理效应也无统计学意义,P= 019042 ;时间 效应有统计学意义,P 010001 ,表明各个时间点上丙氨酸氨基转移酶的水平是不同的。 在表3中,Time一行给出了参照组(此处为b 组)的丙氨酸氨基转移酶下降速度平均估计值及其标 准误,表明参照组的丙氨酸氨基转移酶下降速度为01159

12、6(u/ L)/ 15天,相应的标准误为01020 (u/ L)。为了得到另一处理组的相应数据,将两个组的编码反 一下,即将原来为a组的重新编码为b组,而b组的 编码为a组,之后重新进行模型拟合,结果发现,交互 项的估计值等均不变,但是time行的估计值变为011904(u/ L)/ 15天,标准误为01019(u/ L) ,表明a组的丙氨酸氨基转移酶下降速度较大。这与表1中看到 的结论一致,a组的斜率相对较大。 以上探讨的模型都是假定反应变量随时间变化呈 线性关系,在多数情况下,这种线性随机系数模型用于 评估是否具有时间趋势以及不同处理组的时间趋势是否不同已经足够。但是,在有些情况下,反应变

13、量随时 间变化规律并不一定是线性的,此时,我们也可以进行 随机系数模型的拟合,但采用的是多项式随机系数模 型(polynomial random coefficients model)4,此时的数据集结构如表5所示。其中,time2为原变量time的平方, time3为原变量time的三次方。将时间效应的二次项、 三次项依次引入模型,并且 同时作为固定效应和随机系数引入。只要其方差成分 是正的,则相应的随机系数项即保留在模型中;但是, 固定效应的多项式依次引入模型,直到其没有统计学意义为止,具体见表6。但是,当把时间的三次项( time3)作为随机系数引 入模型时,发现模型不能收敛,因此剔除该

14、项,随机系 数拟合到时间的二次项( time2)为止。但是,时间的三 次项( time3)仍然可以作为固定效应引入模型,此时的 模型即为模型3。其中包括:固定效应: treat , time , time2, time3842Chinese Journal of Health Statistics ,Jun 2008 ,Vol. 25 ,No. 3表6 模型1模型3的主要分析结果汇总ModelFixed effectsG matrix and residual1(linear)Intercept2. 3045(0. 04495)0. 1405- 0. 035980. 012800. 05494

15、Treat- 0. 08627(0. 04111)Time- 0. 1757(0. 01390)2(quadratic)Intercept2. 6413(0. 08353)0. 7274- 0. 51360. 39280. 08508- 0. 066460. 011540. 02419Treat- 0. 08955(0. 04017)Time- 0. 5262(0. 06455)Time20. 07217(0. 01177)3(cubic)Intercept3. 0768(0. 1324)0. 7483- 0. 53280. 41240. 08866- 0. 070270. 012300. 0

16、2104Treat- 0. 08997(0. 04027)Time- 1. 2260(0. 1773)Time20. 3895(0. 07585)Time3- 0. 04263(0. 01007)随机系数: patient , time , time2此时的协方差参数估计值见表7。表7 协方差参数估计值Cov ParmSubjectEstimateSEZPUN(1 ,1)PAT0. 74830. 11496. 52 0. 0001UN(2 ,1)PAT- 0. 53280. 08986- 5. 93 0. 0001UN(2 ,2)PAT0. 41240. 073795. 59 0. 0001UN(3 ,1)PAT0. 088660. 016035. 53 0. 0001UN(3 ,2)PAT- 0. 070270. 01339- 5. 25 0. 0001

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号