文档详情

结构方程模型

xzh****18
实名认证
店铺
PDF
269.04KB
约16页
文档ID:46811229
结构方程模型_第1页
1/16

三、结构方程模型的基本观念(一) 结构方程模型是什么 结构方程模型可以说,就是「路径分析 (path analysis)」和「因子分析 (factor analysis)」 的结合体它的用途,与大家所熟悉的多元回归分析十分相似,但是不同的地方在于,结构 方程模型是一种更为强大的统计方法,在构造模型和估计参数的过程里,可以直接处理多组 方程间的互动干扰、非线性关系、不独立(相关)的自变量、残差相关、衡量误差、以及将 多组相依的衡量模型共冶于一个单一模型当中事实上,我们可以将结构方程模型视为「广 义线性模型 (general linear model: GLM) 」的延伸,它的强大功能,绝对可以用来取代我们惯 用的回归分析、路径分析、因子分析、时间序列分析、甚至共变量分析不过限于篇幅,本 书将聚焦于结构方程模型在因子分析、潜变量路径分析、和一般路径分析上的应用相对于多元回归分析,结构方程模型在应用上的限制也较少,关键的亮点包括在进行 「路径分析」的时候,即使自变量间存在明显的共线性 (multi-collinearity),结构方程模型 依然可以照单全收,丝毫不影响其解释上的有效性利用结构方程模型来进行「验证性因子 分析」,更可以通过将多个可观测变量指定给单一潜变量,从而可以在根源处直接降低衡量 误差。

尤其在残差的处理上,很少有统计方法可以这么方便地直接检查每一个可观测变量的 残差,甚至操弄这些残差之间的相关结构方程模型在路径系数的处理上也高人一等,不仅 可以同时估计多个自变量对多组因变量的关系,还能够进行多样本多模型之间的系数比较 最重要的优势是,结构方程模型不仅仅可以估计单一参数的系数,还能够直接估计整体模型 的拟合度,这是许多传统统计方法所望尘莫及的如前所述,结构方程模型的主要用途,其实是用来验证研究者心中对于他所想象世界的 猜想,而不是用来探索一个新的世界换言之,在应用结构方程模型的一开始,大多数的研 究者在他的心中,早已存在某些定见了这些定见的存在形式,大抵上可以分成两种:(1) 研究者想要检验他的某个想法是否正确,于是构造了一个结构方程模型,在代入真实数据对 模型进行估计后,研究者可以根据拟合指标的好坏,来判断真实世界里的数据,和他所构造 的模型之间是否一致,从而明白他原先的想法是否可以接受2) 研究者根据不同理论,得 出两种或两种以上可以用来描述这个世界的不同看法,然后针对这些不同看法,分别构造出 不同的结构方程模型来,在代入真实数据分别对这些模型进行估计后,研究者可以根据拟合 指标的好坏,来判断究竟哪种看法,更加切合实际。

尽管如此,我们还是可以在文献中看到有些研究者,利用结构方程模型来进行模型探索, 而不是正确使用结构方程模型,来验证心中事先设定的模型猜想例如有些研究者在验证原 先设定好的结构模型时,发现拟合指标很差,于是通过「修正指标 (modification index)」的 暗示,「为数字而数字」地对模型任意调整改动,直到拟合指标达到及格标准为止当然这 样的作法并不可取,因为通过这种过程而勉强予以接受的结构模型,可能只是刚好反映了这 组特定样本的特征,而不是因为模型本身可以放诸四海而皆准,换句话说,是因为这组特定 样本造就了一个事先想象不到、缺乏理论依据的模型,而不是通过真实数据,验证了一个具 有理论深度的模型这样的模型即使拟合指标合格了,可能还是缺乏外部效度,我们很难接 受这样的模型会是能够代表事实真理的模型对于这种情形下所构造出来的结构方程模型, 研究者有必要使用多组不同的样本,对相同模型进行多次验证,也就是「强韧度测试 (robust tests)」,如果多组样本都证实了相同结构模型的「拟合指标」都是及格的,那么我 们才能够正式接受这个结构方程模型二) 结构方程模型的前提假定如前所述,结构方程模型在应用上的限制相对已经较少了,但是它和其他的多变量分析 技术一样,在实际应用的时候,仍然有其特定的前提假定必须遵守。

(1) 结构方程模型里面的「可观测变量」必须服从正态分布 (2) 结构方程模型里面作为「因变量」的「潜变量」必须服从正态分布 (3) 线性关系的假定 (4) 潜变量的假定 (5) 多元的可观测变量 (6) 不存在多重共线性的假定 (7) 残差独立的假定 (8) 不存在接近零的协方差矩阵 (covariance matrix) (9) 适当的样本大小(1) 结构方程模型里面的「可观测变量」必须服从正态分布 由于在估计结构方程模型的拟合指标时,我们所采用的最基本工具是卡方检定 (chi- square test),卡方检定对于变量的正态性 (normality) 十分敏感,即使轻微的违背这个要求, 都可能导致卡方检定结果发生很大的偏差同时,大多数结构方程模型在估计参数时所采用 的方法都是「极大似然估计法」,这方法在应用时的基本前提也是变量的正态性,尤其对于 模型中「内生变量 (endogenous variables)」的正态性更是严格要求,因此「可观测变量」服 从正态分布,是进行结构方程模型时不可回避的必要条件这里补充说明一下,如果「可观 测变量」不服从正态分布,但是其残差却:(a) 服从正态分布,(b) 所有残差的方差都很接近 (代表残差同质),(c) 残差间彼此独立(也就是不相关),这时卡方的估计结果还是不偏 的。

不过这三个条件看来比要求「可观测变量」服从正态分布还要困难 在实务上,避免违背这个条件的简易方法,首先就是尽可能不去使用「顺序尺度 (ordinal scale) 」或是「名目尺度 (nominal scale) 」这种「类别的」,或是「离散的」变量衡 量方法其次,在万不得已必须使用类别型变量衡量的时候,还可以选用一些「转换 (transformation)」技术,来「正态化 (normalize)」那些有问题的变量所谓「转换」,就是 根据变量的分布特征,通过数学代换,将原本不属于正态分布的变量,设法将之转变成具有 正态分布性质的变量常见的转换技术包括:取平方根 (square root)、取自然对数 (logarithmic)、或是函数1/x 反转 (inverse)等等,其中函数反转优于取自然对数,自然对数又 优于取平方根 例如,对于服从「卜瓦松 (Poisson)」分布的变量,我们通常直接对它取平方根,即可赋 予变量正态分布的特征;对于百分比形式的变量,「反正弦 (arcsine )」处理也许是个好方 法;对于二项式分布的变量,通常使用的方法是通过「胜率 (Odds)」转换成概率后,再利 用自然对数函数log(p/(1-p))进行转换;对于「韦布 (Weibull)」型「极值分布 (extreme value distribution)」形式的变量,则使用反转函数log(-log(1-x))进行转换。

无论如何,这些变量转 换必须有根有据,确实依据数学原理让变量获得正态分布的性质,否则再怎么奇巧转换也是 无益的最后,当然还需要利用一些统计方法,来验证模型中所使用的「可观测变量」的正 态性这些方法包括-plot,Shapiro-Wilk Statistic,或是Kolmogorov-Smirnov Statistic 等 等,兹不赘叙2) 结构方程模型里面作为「因变量」的「潜变量」必须服从正态分布 所以结构模型里面,所有的「因变量」都不可以被设计成类别型变量的形式如果万不得已必须使用类别衡量的变量作为因变量,那么必须改用「类别型潜变量分析 (latent class analysis: LCA)」方法处理,一般的结构方程模型软件并不能处理这种问题坊间存在若干特 殊的统计软件是专门用来处理这种类别型潜变量问题的,例如 Statistical Innovations 公司的 Latent GOLD 软件(商业软件),或是Jeroen Vermunt 博士的LEM(自由软件)3) 线性关系的假定 结构方程模型预设了所有的「可观测变量」和它们所属的「潜变量」之间,以及「潜变 量」和「潜变量」之间的关系,都必须是线性的。

不过这倒不至于构成太严重的限制,因为 就和一般的回归分析一样,对于我们所假定的变量间的非线性关系,我们仍然可以针对变量 进行函数转换,来适应这个变量间必须是线性的要求4) 潜变量的假定 在结构方程模型里面,我们基本上假定所有的路径关系,都只能采用非直接衡量的方式 加以处理,也就是只存在「潜变量路径分析」5) 多元的可观测变量 在结构方程模型中,所有的「潜变量」都必需由至少三个以上的「可观测变量」来加以 描述,如果只有一个「可观测变量」在解释着某个特定的「潜变量」,那么这就不是结构方 程模型,而是回归分析如果只有两个「可观测变量」在解释着某个特定的「潜变量」,那 么在模型中,这两个「可观测变量」必须被正式地表述 (specify)为相关,通过对这个相关的 估计(等于新增一个可观测变量),才能够避免因为「可观测变量」不足所导致的「识别不 足 (under identification)」问题,如果「识别不足」,则模型将受制于自由度不足而无法求解, 连带的,当然也无法估计模型的「拟合指标」 一个衡量模型至少必须满足「恰好识别 (just identification)」的条件才可能求解「恰好 识别」的模型又称为「饱和模型 (saturated model)」,也就是模型所构造的协方差矩阵(港 台称为共变异矩阵,covariance matrix)中的元素数量,刚好和所需要估计的参数数量相等, 这时在估计参数的时候,刚好用尽了所有的自由度,所以参数虽然可以被估计出来,但是却 也因此而无法估计「拟合指标」,因为没有自由度的估计,其实就等于是真实的计算,也就 是百分之一百的拟合,或者这么说,其实根本就没有拟合的概念可言。

在这样的情形下,用 来估计结构方程模型的软件,不论是Lisrel 还是AMOS,都将会报告自由度为0,卡方值为 0,同时无法计算显著水平 研究者真正想要的其实是「过度识别 (over identification)」,「过度识别」代表已知变 量间的协方差数量,大于未知的待估计参数的数量,所以这时模型的自由度将会是正的数值, 我们才能够应用结构方程模型的软件来估计参数,同时计算出模型的各种「拟合指标」来 事实上由信度的立场来看这个问题,越多的「可观测变量」通常其结构信度也较佳,这可由 Cronbach's alpha 信赖系数的计算即可清晰观察出来,在同一个构念中,当我们放入的近似的 衡量题项愈多,Cronbach's alpha 的值很容易就可以升高 所以在构造衡量题项的时候,最好尽可能从多维度多视角的多元观点来广泛采纳「可观 测变量」,不要吝惜于「可观测变量」被纳入研究工具中的数量毕竟在研究工具接受前测 中效度信度检查的时候,就可能开始删减题项了,再加上田野调查之后,根据大规模数据进 行衡量模型的效度信度检查时,还可能继续删减题项,如果原始题项不足,在最后的结构模 型分析阶段,就很可能发生「识别不足」或是「恰好识别」的问题,为研究过程带来无谓的 麻烦。

6) 不存在多重共线性的假定 和多元回归分析一样,结构方程模型假定了模型中的变量之间,不存在共线性的问题 但是由于结构方程模型的优势之一,就是可以在模型中直接将共线性清晰地予以表述 (specify)出来,所以,本质上,结构方程模型还是可以处理多重共线性的问题不过,如果 这多重共线性十分严重,在最极端的情形下称之为完全共线,那么就会导致模型中出现「奇 异 (singular) 矩阵」,由于「奇异矩阵」是无法进行某些矩阵代数运算的,例如就不能进行 转置 (inverse) 运算,结果就会使得结构方程模型无法求解7) 残差独立的假定 和多元回归分析一样,结构方程模型也假定了模型中可观测变量的残差之间是不存在相 关的但是由于结构方程模型中,我们一样可以将这些相关的残差,直。

下载提示
相似文档
正为您匹配相似的精品文档