评估中介作用时的混杂性

上传人:豆浆 文档编号:754753 上传时间:2017-05-13 格式:DOC 页数:15 大小:1.35MB
返回 下载 相关 举报
评估中介作用时的混杂性_第1页
第1页 / 共15页
评估中介作用时的混杂性_第2页
第2页 / 共15页
评估中介作用时的混杂性_第3页
第3页 / 共15页
评估中介作用时的混杂性_第4页
第4页 / 共15页
评估中介作用时的混杂性_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《评估中介作用时的混杂性》由会员分享,可在线阅读,更多相关《评估中介作用时的混杂性(15页珍藏版)》请在金锄头文库上搜索。

1、 摘要中介作用通过一个中介变量解释风险因素和产出之间的关系,这是它的步骤中其中的一步。在没有因果循环关系的假设下,我们认为在各种变量中第四个变量可能会成为评估中介作用时的一个混杂因素。由蒙特卡罗研究支持的渐进效果表明在一定条件下,调整混杂因素可能会导致有偏见的估计。一般的原则是为在估计中介作用时适当的调节混杂因素的作用服务的。我们应用指南的中介效应的估计在 125年去世的宗教团体研究参与者的阿尔茨海默病病理 4 载脂蛋白 E 等位基因之间的关系和认知功能,纵向,衰老和阿尔茨海默病的临床病理研究。1.介绍调解模型描述了第三个变量(M)是如何干预的自变量( X)和一个因变量(Y)之间的因果关系的。

2、更具体的说,中介模型假设了自变量( X)影响中介变量(M ),从而进一步影响因变量(Y)。我们用这个 XM Y 的示意图来代表影响途径。我们的研究点在中介效果:通过中介变量 M 后 X 对 Y 的作用。一般情况下是基于路径模型中每一条相关联路径的系数的乘积来评估中介作用的(奥威和豪瑟,1975;男爵和肯尼,1986;博伦,1987;福克斯,1980;索贝尔,1982)。模型如下:M = cM + X + M, (1)0Y = cY + M + X + Y,(2)其中 M 是一个独立于 X 和 Y 的零均值的随机变量,Y 是一个独立于X 和 M 的零均值的随机变量,CM 与 CY 代表不变的截距

3、。这里 是路径 XM0的关联系数, 是在控制 X 变量后路径 MY 的关联系数。根据系数乘积的方法,0通过中介变量 M 后 X 对 Y 的影响被定义为 。剩下的 X 和 Y 之间的联系,用,0被称为“直接影响”,其中可能包括通过一些未知的途径的不明的间接影响和 X 与Y 之间可能存在的之间影响。直接效应和间接效应的总和即 ,被称为 X 对 Y0的累积效应。估计中介效应,通常基于回归方程式(1)和(2)由普通最小二乘估计(OLS)和 。当这两个方程式之间存在真实的因果关系时,最小二乘法对 和0( , )。其结果是, 是中介作用( , )的估计。0 0上述结论关键取决于在假设中,没有其他的干扰变量

4、作为自变量、调节变量和因变量。如果有一个变量 Z 干扰其中的一个变量或者所有的三个变量,那么简单的估算 将和上述不再一致。例如 ,假设 ZM 并且 MX,那么 M 组件之一是 Z。因此,X 和 M 相关,并且最小二乘法对 的估计是有偏见的,即使是在0一个大样本下。在最近的一篇文章中, Herting (2002) 认为,没有纳入一个混杂因素,去拒接中介效用存在的正确的形式是太过于简单了。在本文中,我们认为第四个变量 Z 可以在路径 X M 以任何可能的方式作为混杂因素。我们调查的调解作用在所有我们考虑的方案中各种估计的属性。提供了不同估计的渐进偏见。一些模拟实验来评估的有限样本渐近结果的准确性

5、。基于渐近结果和数值的证据,我们就如何在经验应用中选择估计变量给了一些指引。我们的方法被应用到临床诊断阿尔茨海默氏病(AD)时估计中介效应的风险因素中,其中年龄是一个可能的混杂因子。AD 是一种渐进性脑疾病,逐渐破坏一个人的记忆和学习新的信息的能力,即沟通和进行正常的日常生活的能力,随着年龄的增加患 AD 的风险也会随之增加。仅仅在美国就有 500 万人患有 AD,而这个数字在未来的几十年里将会随着人口老龄化而在全球范围内逐渐增长。最近证据表明 AD 的临床表现是多种遗传和环境因素与大脑中的病理和生化改变相互作用的复杂结果。例如,尽管 AD 的病理标志是神经炎斑和神经原纤维缠结,这些病变可能会

6、增加大脑的其他疾病,如脑梗甚至引起认知障碍(彼得罗维奇等人,2005)。与此相反,环境风险因素可以修改 AD 病理学的认知关系。一个载脂蛋白 E4 等位基因的存在(APOE 4,该基因编码载脂蛋白 E 的共同的多态性)是用于所述疾病的主要遗传风险因素(Tang 等人,1998)。通过该 4 等位基因与临床诊断的 AD 的风险升高相关联的神经生物学机制还不是很清楚。先前的组织病理学研究(例如,Bennett 等,2003)表明,4 等位基因对认知功能障碍的效果可通过增加在该 AD 病理学累积速率来介导的。由于 AD 病理学可能会增加,或与其他因子相互作用以引起认知功能障碍,各种备选的机制也可以解

7、释之间的关联。因为认知作用,AD 病理学和许多 AD 的风险因素均与年龄相关,要能够调整为年龄在老年人的常见的慢性疾病中介分析的潜在混杂影响是重要的。我们应用不同的策略来评价混杂因子,死亡年龄,广告病理学 Apoe4 等位基因的存在之间的关系和认知功能水平之前死亡 125 例在宗教团体的研究中,纵向 ,衰老的临床病理研究和广告中中介作用的评估。本文其他部分的研究如下,第二章介绍了 Z 作为一个混杂因子影响路径XMy 的所有可能方式。在我们的研究中,Z, X,M 和 Y 分别对应于死亡年龄,APOE4, AD 病理学和认知功能。第三节考察不同的估计方法中中介作用的渐进性质。第四节介绍仿真结果。第

8、五节讲应用程序。第六部分是结论,并给出了选择估计量的一些建议。2.路径模式我们首先假定一个通路模式 XM。我们进一步假定 X,M,和 Y 是以线性方式相互关联,如图所示,例如在方程(1)和( 2)中当结果是 0 的时候一个完整的中介就出现了,这样 X 和 Y 之间就完全被 M 中介,X 对 Y 没有直接的影响。事实上,一个完整的中介是不可能的,并且一个长远的影响通常保持在一个中介模型中,即使它在统计学上是不显著的。假定在路径中没有循环,那么一个周期以为着变量可能通过路径中的其他变量影响其本身。表 1 通过四分之一的混杂因子 Z 和 X,M 和 Y 提供了所有可能的通路路径组合。该路径模式分为四

9、种不同的类别。第一种类别,表示为基准的情况下,由表壳 0.0,其中 Z 与 X,M 和 Y 不相关。第二类包含七个形式(例 1.1-1.7)第四个变量 Z 在在路径 X,M 和/或 Z 的开始。第三类由七个形式组成(例 2.1-2.7),其中 X,M 和/或 Y 在到 Z 的路径的最前端。最后一类是由剩余的五个形式组成(例 3.1-3.5),涉及 Z 和 X,M 和 Y 更复杂的路径的关系。每个通路可以由路图来表示。例如,基准案例 0.0,可以简单地表示为XMY 并且相应的模型在方程(1)和(2 )中给出。作为第二个例子,图 1 为例 3 和例 4 提供了路径示意图,其中自变量 X 通过中介变

10、量 M 对因变量 Y 有间接的影响,通过第 4 个变量 Z 对 Y 有间接影响,对 Y 有直接的影响。另外,上述第四个变量 Z 对中介变量 M 有着直接的影响。例 3 和例 4 的正确模型可以写为:表 1Z 和 XM 因果途径的关系 图一 因果模式的路径图 例 3.4X, Z, M, Y 是均值为 0,方差为 的随机变量。在上面的模型中我们对 使用了一个下角标 ZM 来表示 Z 对 M 的影响。其他的也具有类似的含义,在应用中,X 是以 ApoE 4 存在的,Y 是认知功能水平,M 是 AD 病理学的水平,Z 是死亡年龄。在方程(3) - (6)中,每个 是独立于相应的方程的右边的变量。这种独

11、立性对单项因果关系有着独立的影响,如果没有这种假设, 一般取决于方程右边的变量。单向因果关系的假设是我们的中介框架的基石,适用于所有型号的调解。我们在整篇文章中都运用这个假设。对大多数路径来说,中介效果通过 M 后是 ,有少数例外(例 3.13.4),通过 M 出现了 X 对 Y 影响的两条路径,例如,在例子 3 和 4 中,这两个路径是 X M Y 和 X Z M Y。在第一条路径中,X 对 M 有着直接的影响。在第二条路径中,Z 在 X 和 M 间是一个中介变量。X 对 M 的总效应是间接效应 和直接效应 。X 对 M 的总影响乘以 ,即 M 对 Y 的直接影响,提供了通过 M 后 X 对

12、Y 的中介作用,定义为 :对于其余情况的中介作用列于表 2 的第二列中。3.中介作用的估计第二节列举了 20 因果模式,其中四分之一混杂变量可能通过因果途径 XM 进行干预。3.1 四种不同的估算策略第一估计策略,称为策略 A,它忽略了混杂因素并且在没有变量 Z 的情况下适合回归方程,回归方程如下式:其中带帽子的参数表示用最小二乘法进行的估计, 和 是通过最小二乘法回归后M 和 Y 的预测值。表 2 通过中介变量 M 后的间接影响 符号中的几个字是有顺序的, 的 下标意味着 M 对 X 的回归中 是 M 的系数。在本文中我们对其他的符号定义类似的规定。其中回顾 7 是一级回归,回归8 是二级回

13、归。 和 进行最小二乘估计,估计的中介效果是第二个估计策略,被称为战略 B,是忽略了 XM 因果通路的混杂变量,回归方程通过测量 B 给出:中介作用的估计效果是:第三估算策略,叫做策略 C,由下式给出忽略在 MY 因果路径的混杂变量。中介作用所产生的估计是 最后,第四估计策略,称为策略 D,两个回归方程中都包括混杂变量 Z,从而导致中介作用的估计效果是在应用中,通常的四种评估策略之一应用在没有知识关系的混杂因子 Z 和 X MY 因果路径之间。在接下来的小节中,在接下来的小节中,我们提出了概率极限 代表表 1 给出的所有可能的因果模式。3.2 渐进偏见对于每一个因果模式,我们得出每个估计的概率

14、极限。这个限制和真实的中介作用之间的差被定义为渐近偏差。根据此定义,当渐近偏差为零,则估计和表 2 的第二列中给出的正确的中介的作用相一致。我们首先使用案例 3.4 演示渐近偏差的推导。用公式(3) - (4),我们可以推断出,其中 X 和复合误差项 ZMZ+M 的相独立。因为 OLS 估计和底层模型参数一致,通过一个常数和 X 回归 M 得到的最小二乘估计的概率极限是:上述限制适用于方案 A 和 B,既无视 Z 在他们的第一阶段回归。像方案 C 和 D,当 Z 在第一阶段回归,用公式(5),我们可以推断出:我们现在转向第二阶段的回归。战略 B 和 D 结合 Z 进入回归。在这种情况下,OLS

15、 估计的概率限值:对于策略 A 和 C,协变量 Z 从回归省略。 OLS 估计量的概率极限是: 它遵循公式(3)到(6)将上述表达式插入(12)的收益率组合(9),(10),(11)与(14)中,我们得到每个估计量的概率极限:当是真正的中介作用时,那么每个估计的渐近偏差由下式给出:根据底层模型参数,当 是渐进偏见时, 是渐进无偏。了解不同估计的偏置特性,请注意,在 的结构中,Z 被正确地包括在第二阶段回归中。由于 Z 被省略,由第二阶段 OLS 回归估计的 M 对 Y 的影响会不一致。这是在不一致的情况下对 的估计。另一方面,Z 不包含在策略 B 的第一阶段回归中。根据 Z 导致 M,X 导致

16、 Z,第一阶段对 的最小二乘估计,似乎忽略了 Z 遭受遗漏变量偏差的影响。然而,我们的目标是估计 X 对 M 的总影响。当省略了 Z,第一步对 的最小二乘估计不仅得到了 X 对 M 的直接效应,还有通过中间变量 Z 的间接影响。因此 刚好提供了我们想要的。与此相反,通过在第一阶段包括 Z 的估计,第一步对 的最小二乘估计只得到了 X 对 M 的直接影响。因此,根据对 的估计与真正的中介作用是不一致的。接下来,我们考虑一般的情况。估计量下对于不同的因果型态的四个估计策略的概率范围概括在最后四列表 2。由于大部分的概率范围具有复杂的形式,表 2 中只给出了几个例子。这些概率限值等于第一级 OLS 估计乘以所述第二阶段 OLS 估计的极限。如果两个估计是不一致的,由此产生的估计为中介效果也是不一致的。导致的两个估计的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 机械/制造/汽车 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号