文档详情

多元统计分析(何晓群)第十章路径分析

j****9
实名认证
店铺
PDF
432.43KB
约50页
文档ID:47782328
多元统计分析(何晓群)第十章路径分析_第1页
1/50

第十章路径分析?学习目标??1. 了解路径分析和回归分析的区别,了解路径分析的假设 条件;?2. 理解路径分析所涉及的基本概念;?3. 理解路径系数的求解原理,并能使用软件求出路径系 数;?4. 能够检验中间变量的中间作用;?5. 能够使用Wright规则对路径图中的相关系数进行分解;?6. 理解对模型进行调试的意义,并能对模型进行检验;?7. 能够运用合适的软件,采用路径分析解决实际问题20世纪初,“Pearsn原理”在生物遗传学(在过 去几乎就是我们现在所称的统计学)中占统治地 位Pearsn原理的一个基本内容就是相关关系是 现实生活中最基本的关系,而因果关系仅是完全 相关的(理论)极限这种理论认为没必要寻找 变量之间的因果关系,只需计算相关系数然而 相关分析逐渐暴露出自身的很多局限:一是仅反 映变量之间的线性关系;二是反映变量之间的关 系是对称的,而很多变量之间的关系是非对称 的;三是只有在正态假设下,正态细想才是有效 的在遗传学中,很多现象具有明显的因果关系,如 父代与子代的基因关系,父代在前,子代在后, 二者的关系只能是单向的,而非对称的对这种 变量结构进行思考,遗传学家休厄尔·赖特 (Sewall Wright)于1918—1921提出路径分析 (path analysis),用来分析变量间的因果关系。

现代的路径分析由于生物遗传学家、心理测验学 家、计量经济学家以及社会学家的推进,引入隐 变量(laten variable,又称unmeasured variable,不可观测变量),并允许变量间具有测 量误差,并用极大似然估计代替了最小二乘法, 成为路径系数主流的估计方法路径分析现在成为多元分析的一种重要方 法,广泛应用于遗传学、社会学、心理学、 经济问题和市场调研领域然而习惯上把基 于最小二乘的传统的路径分析称作路径分 析,而把基于极大似然的路径分析称作结构 方程式模型(structural equation modeling , SEM)本章主要介绍传统的路径分析,不 进行特别说明,本章所提到的路径分析均指 基于最小二乘的路径分析,结构方程模型放 在下章介绍关于基本概念如路径图、直接作用、间接 作用的理解对于掌握路径分析非常重要,这 些概念共同构成了路径分析的基本理论10.1 基本概念和理论10.1.1 路径图?路径分析的主要工具是 路径图,它采用一条带箭头 的线(单箭头表示变量间的 因果关系,双箭头表示变量 间的相关关系)表示变量间 预先设定的关系,箭头表明 变量间的关系是线性的,很 明显,箭头表示着一种因果 关系发生的方向。

在路径图 中,观测变量一般写在矩形 框内,不可观测变量一般写 在椭圆框内,对于简单的路 径模型,可以直接用字母表 示变量,绘出路径图C1BC2A图 10—111P21P1e12P12r2e2eP21P22P?图10—1是一个简单的路径图,A表示父亲智商, B表示母亲智商,C1,C2是两个成年子女的智商, e1, e2是与A, B不相关的另外原因变量一般来 说,父母亲的智商之间不存在关系;父母亲的智商 对子女的智商存在因果关系,用单箭头表示;子女 间存在相关关系,用双箭头表示箭头上的字母表 示路径系数,路径系数反映原因变量对结果变量的 相对影响大小在路径分析中,一般采用经过标准 化后的变量,没有特别说明,均指经过标准化后的 变量可以把图10—1写成方程式的形式:121112112 12222 12212122211 12121 1212eeCp Ap Bp r ACp r BCp eCp Ap Bp r ACp r BCp e=++++=++++(10.1)?式(10.1)实际上是普通的多元回归方程,多元回 归分析是因果关系模型的一种,但它是一种比较简 单的因果关系模型,各个自变量对因变量的作用并 列存在,它仅包含一个环节的因果结构。

路径分析 的优势在于它可以容纳多环节的因果结构,通过路 径图把这些因果关系很清楚的表示出来,据此进行 更深层次的分析,如比较各种因素之间的相对重要 程度,计算变量和变量之间的直接和间接影响,这 在后面会涉及图10—2是有关一种消费性电子产 品(如)路径分析的例子(这里省略了路径系 数),四个变量中,耐用性、使用的简洁性、通话 的效果和价格两两相关,决定感知价值,同时通过 感知价值决定客户忠诚度相对于图10—1,它具 有两层因果关系接下来主要是以图10—2为例, 说明路径图中的一些基本概念耐用性使用的简单性通话效果价格感知价值客户忠诚度e5e6图10—2?路径图上的变量分为两大类:一是外生变量 (exogenous variable, 又称独立变量,源变量), 它不受模型中其他变量的影响,如图10—2的耐用 性、使用的简单性、通话效果和价格;与此相反, 另一类是内生变量(endogenous variable, 又称因 变量或下游变量),在路径图上至少有一个箭头指 向它,它被模型中的其他一些变量所决定,如图 10—2的感知价值由耐用性、使用的简单性、通话 效果和价格四个变量和随机误差e5决定,忠诚度取 决与四个外生变量、感知价值和随机误差e6。

此 外,我们可以将路径图中不影响其他变量的内生变 量成为最终结果变量(ultimate response variable),最终结果变量不一定只有一个图 10—2中忠诚度是最终结果变量10.1.2 内生变量和外生变量内生变量和外生变量?其他变量(A)对内生变量(B)的影响有两种情况: 若A直接通过单向箭头对B具有因果影响,称A对B 有直接作用(direct effect);若A对B 的作用是间 接地通过其他变量(C)起作用称A对B有间接作用 (indirect effect),称C为中间变量(mediator variable)变量间的间接作用常常由多种路径最终 总合而成图10—2中,四个外生变量耐用性、使 用的简单性、通话效果和价格既对忠诚度有直接作 用,同时又通过感知价值对忠诚度具有间接作用10.1.3 直接作用和间接作用直接作用和间接作用?如果模型中包含中间变量,首先从理论角度考虑,这个中间作用是否 有理论依据,其次实际工作者会提出这样的问题:“模型中中间变量的中 间影响显著吗?”这些问题涉及对中间变量的间接作用进行检验巴伦和 肯尼(R. M. Barron, D.Kenny,1986)提出了检验中间变量间接作用是否 统计显著的一种做法。

第一步:用中间变量(感知价值)对外生变量耐用性,使用的简单性、 通话效果和价格四个变量进行回归;?第二步:用内生变量(感知价值)对外生变量耐用性、使用的简单性、 通话效果和价格四个变量进行回归;?第三步:用忠诚度对第一步中的四个变量以及中间变量感知价值进行 回归阿加沃尔和蒂斯(S. Agarwal, R. K. Teas, 1997)的工作表明“如果 (a)在第一步的估计中解释变量统计显著;(b)在第二步的估计中解 释变量统计显著;(c)在第三步的估计中变量统计显著,则说明中间变 量的间接作用显著”假设对图10—2进行简介作用检验,得到表10—1,见文献[4]10.1.4 间接作用的检验间接作用的检验第一步 感知价值第二步 忠诚度第三步 忠诚度说明耐用性 使用的简单性 通话效果 价格 感知价值0.26 0.08 0.15 0.390.65 0.07 0.14 0.080.62 0.06 0.12 Ns 0.12部分间接作用 部分间接作用 部分间接作用 完全间接作用因变量自变量表表10—1间接影响的检验结果间接影响的检验结果注:所有的间接作用参数均为统计显著的对每一外生变量,存在三种可能的中间结果:没 有间接作用(no mediation)、部分间接作用 (partial mediation)和完全间接作用(full mediation)。

如果第一步中外生变量的回归系数不 是统计显著或者第三步中(中间变量)感知价值的 回归系数不显著,说明该外生变量不存在间接作 用;如果某一外生变量(如耐用性、使用的简单性、 和通话效果)再第一步和第三步中的回归系数都是 统计显著的,说明该外生变量存在部分间接作用; 如果某外生变量(价格)的回归系数在第一不显 著,而在第三部不显著,说明该外生变量存在完全 的间接作用广义的路径模型有两种基本类型:递归模型和非递归模型 两种模型在分析时有所不同,递归模型可以直接通过最小二 乘求解,而非递归模型得求解比较复杂尽管本章主要介绍 基于最小二乘得路经分析(即递归路径模型),但同时也要 求读者能够预先正确判断一个模型的所属类型,才能保证应 用路径分析不会出错因果关系结构中,全部为单向链条关系,无反馈作用得模 型称为递归模型(recursive model)无反馈作用意味着, 各内生变量与其原因变量的误差项之间或各两个内生变量的 误差之间必须相互独立与递归模型相对的另一类模型称为 非递归模型(nonrecursive model)一般来说,非递归模 型相对来说容易判断,如果一个模型不包括非递归模型的特 征,便是递归模型。

10.1.5 递归路径模型和非递归路径模型递归路径模型和非递归路径模型?如果一个路径模型包括以下四种情况,便是非递归模型1) 模型中任何两个变量之间存在直接反馈作用,在路 径图上表示为双向因果关系如图10-—3(a)所示2) 某变量存在自身反馈作用,即该变量存在自相关, 如图10—3(b)所示3) 变量之间虽然没有直接反馈作用,但是存在间接反 馈作用,及顺着某一变量及随后变量得路径方向循序前进, 经过若干变量后,又能返回这一起始变量,如图10—3(c) 所示4) 内生变量的误差项与其它有关项相关,如结果变量 得误差项与其原因项相关(图10—3(d)),或者不同变量 之间的误差项之间存在相关(图10—3(e))ABp12p21图10—3(a)图10—3(b)ABABCABABCC图10—3(c)图10—3(d)图10—3(e)e2e2e223p12p13p33p12p23p31p12p2 ,2ep 12p23p12r 32eer3 ,3ep2 ,2ep?使用最小二乘的估计方法要求路径模型具有一些假 设要求和限制,现在总结如下:?(1) 首先要求模型中各变量的函数关系为线性、 可加,否则不能采用回归方法估计路径系数。

如果 变量之间存在交互作用,把交互项看作一个单独的 变量,此时它与其他变量的函数关系同样满足线性、 可加2) 模型中各变量均为等间距测度尽管路径分 析中通常会使用二分数据(dichotomies data)或 者顺序数据(ordinal data),然而不能使用超过一个 值的虚拟变量,因为这会违反递归性要求10.1.6 (递归)路径模型的假设条件(递归)路径模型的假设条件?(3) 每一内生变量的误差项不得与其前置变量相 关,同时也不得与其他内生变量机器误差项相关 这是对模型递归性的要求另外,模型不考虑外生 变量的相关性,即不对外生变量的相关性进行分析4) 模型中得因果关系必须为单向,不得包括各 种形式的反馈作用这同样是对模型递归性的要求5) 各变量均为可观测变量,并且各变量的测量 不能存在误差这两个弱点在SEM技术中得到了克 服,已经发展了一套成熟的处理隐变量和测量误差 的技术6) 变量间的多重共线性程度不能太高,否则路 径系数估计值的误差将会很大7) 需要足够的样本量克兰(Kline,1998)建议样本量 得个数应该是需要估计的参数个数得10倍(20倍更理想)?上述假设条件用数学符号很容易说明,但有些抽象。

任何 一个(递归)路径模型都可以用结构方程组表示,假设?和分别为模型中的内生和外 生可观测变量向量:是的参系数矩阵,可以证明, 若为路径递归模型,则总可以写成上三角矩阵,是?的参系数矩阵,e为内生变量所对应的误差项,满。

下载提示
相似文档
正为您匹配相似的精品文档