第一讲 探索性因素分析

上传人:飞*** 文档编号:49167809 上传时间:2018-07-24 格式:PPT 页数:41 大小:237.50KB
返回 下载 相关 举报
第一讲 探索性因素分析_第1页
第1页 / 共41页
第一讲 探索性因素分析_第2页
第2页 / 共41页
第一讲 探索性因素分析_第3页
第3页 / 共41页
第一讲 探索性因素分析_第4页
第4页 / 共41页
第一讲 探索性因素分析_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《第一讲 探索性因素分析》由会员分享,可在线阅读,更多相关《第一讲 探索性因素分析(41页珍藏版)》请在金锄头文库上搜索。

1、第一讲 探索性因素分析北京师范大学心理系刘红云主要内容因素分析简介 因素分析模型 因素分析中的基本概念 求共因素的主要方法 因素旋转方法 因素得分 应用因素分析应该注意的问题 因素分析应用举例因素分析简介行为科学和社会科学研究中多变量之间 的统计分析方法主要有: 1.将多个变量与某种称为准则变量的外 部变量联系起来进行分析。回归分析、 方差分析等。 2.不使用外部准则而同等地对待所有变 量,分析它们之间的相互关系。相关分 析、因素分析等。探索性因素分析探索性因素分析(Exploratory Factor Analysis )是一种常用的多元数据分析方法,它是从 众多可观测“变量”中,概括和推论

2、出少数不可 观测的“潜变量”(又称因素),目的在于用最 少的因素去概括和解释大量的观测事实,并 建立起最简洁的,基本的概念系统,以揭示 事物之间的本质联系的一种统计分析方法。 这种方法的原则是在尽可能保存原有资料信 息的前提下,用较少的维度去表示原来的数 据结构。 因素分析模型因素分析假定个体在某一变量上的反应由两部分组成:一 是各个变量共有的部分,称为共同因素(Common Factor );另一部分是各变量所特有的部分,称为独特因素( Unique Factor),可用下式表示:是第i个体在第j观测变量上的得分,( j k)是因素对观 测变量的加权系数,(Fik)是个体i在因素F k上的得

3、分 ,Uij为特殊因素,dj为特殊因素对观测变量的加权系数; N为样本容量,n为观测变量的个数,m为共因素的个数。 因素分析的模型主要有全分量模型和公因子模型两个。 全分量模型 (主成分分析模型)是指用n个新的因素来线性表示n个观测变量的因素分析 模型(m=n)。此模型希望从一组相关观测变量中每次取得的一个公 共因素的方差在观测变量的全部方差(或剩余方差) 中所占的比例最大,这一思想也是全分量模型确定公 共因素的一种数学准则。 但在实际应用中,人们总是 只取少数几个对观测变量的方差贡献较大的即为首的 几个因素。于是得到截分量模型 截分量模型(主成分分析模型 )在实际应用中,人们总是只取少数几个

4、对观 测变量的方差贡献较大的即为首的几个因素 。有些人把几个方差贡献较小的因素看作误 差项。于是全分量模型就成为:(j=1,2,3, n mn)这一模型确切地说应称为截分量模型( truncated component model),但经常被称 作主成分分析模型。误差项ajej表示被忽略的 几项因素之和。 公共因素模型 指所有观测变量中每个观测变量均可被表示为m个公共 因素和一个唯一性因素的线性加权之和:(j=1,2,3, n mn)其中公共因素可以解释观测变量之间的相关,唯一性 因素则用以解释观测变量除去公共因素的影响后所剩 下的那部分方差。公共因素模型这一模型希望从观测变量中抽取到的因素能

5、尽可能好 地再生观测变量之间 的相关。在这一模型中将观测 变量、公共因素和唯一性因素都假定为标准变量,平 均数为0,标准差为1,而且n个唯一因素uj之间相互 独立,每个唯一性因素与各个公共因素Fp(p=1,2, ,m)之间相互独立。各公共因素Fp是随机变量。 若假定各公共因素为互相独立的正态分布,则观测变 量Zj就服从多元正态分布。在实际应用公共因素分析 方法时,通常把唯一性因素看作不包括模型误差,也 就是说因素分析没有考虑抽样误差。因此,抽样就必 须足够大,以使抽样误差被忽视,样本究竟多大合适 ,一般至少要大于100,或者是变量数目的510倍。 因素分析中的基本概念因素载荷(Factor l

6、oading)公共因素方差(Communality)唯一性方差(uniqueness)特征值(Eigenvalue)贡献率(Explain of Variance)因素载荷(Factor loading)因素载荷指因素分析模型中各公共因素 对观测变量的加权系数jk 。一般情况 下,称共因素的系数为因素载荷。即因 素分析模型中的系数。将所有的因素载 荷以矩阵的形式表示即为因素载荷以矩 阵。公共因素方差公共因素方差一般用h2表示,又称作“共 同度”或“公共性”,公共因素方差是指被 公共因素所决定的方差在观测变量总方 差中所占的比例。 在对观测数据进行标准化的情况下,一 个观测变量的总方差Sj2为:

7、其中由公共因素决定的方差为:公共因素方差在测验或特质行 为的研究方面主要有以下用途 :1. 公共因素方差能反映该测验对所要测量行 为属性的测量程度,公共因素方差越大,该 因素所能反映的行为属性程度就越强,某一 因素的方差贡献率越大,说明该因素在他所 测量的特质中,它所起的作用就越大。 2.如果在构成一个测验的诸多项目中,某些项 目构成的因素的公共方差大,说明这些项目 测定被试的个别差异的功能强,也说明该组 项目的区分度好,鉴别力高,同理公共因素 方差越小,该项目的鉴别力越低。因此项目 的公共因素方差,可用作评价项目区分度的 一种指标。唯一性方差(uniqueness)归因于唯一性因素的那部分方

8、差称 为唯一性方差,唯一性方差表示m 个公共因素对观测变量的方差不能 作出解释的部分,一部分归因于所 选变量的特殊性,称为特殊性方差 ;剩余部分归因于测量的不完备性 。 特征值特征值: 对于一个n阶矩阵A,如果 存在一个n维向量v和一个常数,满足 条件则称为矩阵A的一个特征值,称v为 对应于特征值的一个特征向量。特征值在因素分析中,特征值表示每个因素 在所有变量上的因素负荷的平方之和 ,它反映某一公共因素对各观测变量 的影响程度,也说明该公共因素的重 要性。特征值越大,说明该公共因素 相对重要。贡献率各因素的特征值(j)在总的公共 因素方差之和中所占的比例。反映 该因素对所有观测变量变异影响的

9、 大小。第j个共因素的方差贡献率为 :变量共同度的估计在全分量模型中可以直接用相关矩阵求 解因素载荷矩阵,在公共因素模型中, 由于考虑特殊因素对变量的影响,求解 因素载荷矩阵则以约相关矩阵为出发点 。估计变量的共同度是得到约相关矩阵估 计的关键,最大相关系数估计法最大相关系数估计法是把原相关矩阵每 一行(或每一列)绝对值最大的一个元 素作为该行(或该列)变量共同度的估 计。复相关系数平方估计法Z J变量的复相关系数的平方为:其中RJJ 为对角线元素为1的相关矩阵R的 逆矩阵中第j个变量对角线的元素,SMC 是共同度估计的下限。公共因素个数的确定根据累计贡献率确定因子个数 以特征值是否大于等于1

10、为标准碎石检验根据累积贡献率确定因子个数将约相关矩阵(在主成分分析中,用相 关矩阵)的特征值从大到小排列,根据 前面若干个共同因素所对应的特征值之 和的百分比来确定。一般来说,这一比 例要达到80%以上,但根据问题的复杂 程度可做适当调整。.以特征值是否大于等于1为标 准特征值大于等于1的选为共因素,小于1 的不选。碎石检验(screen test)以特征值为纵坐标,以因素个数为横坐 标,按照因子被提取的顺序,画出因子 的特征值随因子个数变化的散点图,根 据图的形状来判断抽取因子的个数。从 第一个因子开始,曲线逐渐下降,然后 变得平缓,最后近似于一条直线,曲线 变平的前一点被认为是提取的最大因

11、子 数。初始因素载荷矩阵求解对于全分量模型来说,直接从变量相关矩阵 入手求解因素载荷矩阵;而对于公共因素模 型,则从约相关矩阵出发来求解因素载荷矩 阵A。目前,求解因素载荷矩阵使用较为普遍 的一种方法是主因素解法(在全分量模型中 称为主成分分析法)。它的基本思想是,考 虑第一共同因素的方差对所有变量的方差贡 献最大,第二共同因素对所有变量的方差贡 献次之,依次将全部变量的方差分解为 各共同因素方差,最终求得因素载荷矩阵。 求初始因素载荷矩阵的一般方法Principal ComponentsUnweighted Least SquaresGeneralized Least SquaresMaxi

12、mum LikelihoodPrincipal Axis FactoringAlpha FactoringImage Factoring旋转变换初始因子解达到了数据化简的目的。在求初 始因子这一步中,我们既确定了共因素个数 ,又确定了每个变量的公因子方差。可是根 据初始因子解,往往很难解释因子的意义, 大多数因子都和很多变量相关,但是在实际 研究中,我们往往关心每个因子的实际意义 是什么。因子旋转是寻求这一实际意义的有 效工具,因子旋转的目的是通过改变坐标轴 的位置,重新分配各个因子所解释的方差的 比例,使因子结构简单并易于解释。因子旋 转不改变模型对数据的拟合程度,不改变每 个变量的公因子方

13、差。因子旋转的方式因子旋转的方式有两种,一种是正交旋 转,另一种是斜交旋转。正交旋转是使 因子轴之间仍然保持90度角,即因子之 间是不相关的,而在斜交旋转中,因子 之间的夹角可以是任意的,即因子之间 可以相关。正交旋转四次方最大法( QUARTIMAX)通过使因子载荷矩阵中每一行因子负荷平 方的方差达到最大求得因子解。最终的 简化准则为: 方差最大法(VARIMAX)四次方最大法的不同是它从简化因子负荷 矩阵的每一列出发,使和每个因子有关 的负荷平方的方差最大。方差最大法通 过使下式达到最大求得因子解:等量最大法(EQUIMAX)等量最大法把四次方最大法和方差最大法 结合起来,取V和Q的加权平

14、均作为简化 准则,通过使下式达到最大:权数等于m/2,和因子数有关,当因子 数为2时,等量旋转法结果与方差最大 法旋转结果相同。斜交旋转常见的为OBLIMIN,该方法应用斜交参考轴 求解。所谓的斜交参考轴是指斜主因子轴的 垂直线。斜交因子解应使变量尽可能落在主 轴附近,变量落在主轴附近和变量在参考轴 上的投影近似为零这两个条件是相同的。 OBLIMIN方法首先求出斜交参考矩阵,斜交 因子负荷矩阵等于斜交参考阵的逆矩阵再按 行进行规范化处理,使矩阵中每一行的元素 的平方和等于1。参数控制因子斜交的程度 ,其取值一般小于等于零,等于零时,因子 之间的斜交程度最大,小于零时因子之间的 斜交程度减小。

15、另外还有Promax法。6因子得分及应用在公式中可以将变量表示成公共因素的线性组 合。但在有些场合,需要考虑通过变量 Z的值来获得共因素指标F的值。这种由 变量的观测值来估计各公共因素值的方 法称为因素得分。因素得分及其应用求因素得分涉及到用观测变量来描述因 素,第p个因子在第i个个案上的值可以 表示为:其中,zji 是第j个变量在第i 个个体上的值 , wpj 是第p个因子和第j个变量之间的 因子值系数。因素得分及其应用因子分析模型中是用因子的线性组合来 表示一个观测变量,因子负荷实际是该 线性组合的权数。求因子得分的过程正 好相反,它是通过观测变量的线性组合 来表示因子,因子得分是观测变量

16、的加 权平均。因为各个变量在因子上的负荷 不同,所以不能把变量简单相加,权数 的大小表示了变量对因子的重要程度。因素得分及其应用对于主成分分析法得到的因子解,可以 直接得到因子值系数,对于其他方法得 到的因子解,只能得到因子值系数的估 计值,通过用回归法得到因子得分系数 的估计值。有了因子得分,就可以把因 子作为变量来用,进行其他的统计分析 。应用因素分析应该注意的问题1.对数据的要求(1)数据类型(2)数据分布(3)对变量之间相关的检验SPSS提供了三个统计量帮助判断观测 数据是否适合作因素分析对变量之间相关的检验v反映象相关矩阵(Anti-image correlation matrix) 其元素等于负的偏相关系数。 v巴特利特球体检验(Bartlett test of sphericity) 对应的零假设为相关矩阵为单位矩阵。 vKMO(Kaiser-Meyer-Olkin Measure of Sampli

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号