如何用spss软件进行主成分分析_郭显光

上传人:子 文档编号:47220284 上传时间:2018-07-01 格式:PDF 页数:5 大小:344.58KB
返回 下载 相关 举报
如何用spss软件进行主成分分析_郭显光_第1页
第1页 / 共5页
如何用spss软件进行主成分分析_郭显光_第2页
第2页 / 共5页
如何用spss软件进行主成分分析_郭显光_第3页
第3页 / 共5页
如何用spss软件进行主成分分析_郭显光_第4页
第4页 / 共5页
如何用spss软件进行主成分分析_郭显光_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《如何用spss软件进行主成分分析_郭显光》由会员分享,可在线阅读,更多相关《如何用spss软件进行主成分分析_郭显光(5页珍藏版)》请在金锄头文库上搜索。

1、如何用 SPSS 软件进行主成分分析郭显光摘 要 文章指出 统计分析软件 SPSS/ PC+ 中主成分分析举例中的一处错 误, 比较了主成分分析和因子分析的异同, 进而指出用 SPSS 软件不能直接进行主成 分分析。作者根据主成分分析和因子分析的关系, 提出一种先用SPSS 的 PC 法得出 因子载荷阵, 然后求出特征向量, 建立主成分模型的主成分分析计算方法。 关键词 主成分分析 因子分析 因子载荷阵 特征向量一、 关于主成分分析举例中的一处错误在 SPSS 的高级统计分析命令中, 有因子分析的功能。 例如, 用FACT OR 命令可以进行因 子分析, 用 EXT RACT ION 子命令可

2、以输出因子模型阵、 变量被解释的因子方差、 所提取的因 子特征根和每个特征根代表的变量 X 总方差的百分比。在使用该命令时, 可以指定提取因子 的方法, 包括 PC( 主成分法) 、 PAF( 主轴因子法) 等等, 也可以指定因子旋转方式。 在童忠勇教授主编的 统计分析软件 SPSS/ PC+ ( 陕西人民教育出版社, 1990 年) 一书 中, 第 213- 215 页给出了一个例子: 某地区对下属 12 个县人口调查, 其中 5 个经济变量为: X1( 住户数) 、 X2( 学校数) 、 X3( 就业人数) 、 X4( 年收入) 、 X5( 人口数) 。现对这 5个经济变量进 行主成分分析

3、。数据及程序如下: DAT A LIST FREE/ X1 X2 X3 X4 X5 BEGIN DATA. DAT A 5700, 12. 8, 2500, 270, 25000 DAT A 1000, 10. 9, 600, 10, 10000 DAT A 3400, 8. 8, 1000, 10, 9000 DAT A 3800, 13. 6, 1700, 140, 25000 DAT A 4000, 12. 8, 1600, 140, 25000 DAT A 8200, 8. 3, 2600, 60, 12000 DAT A 1200, 11. 4, 400, 10, 16000DAT

4、A 9100, 11. 5, 3300, 60, 14000 DAT A 9900, 12. 5, 3400, 180, 18000 DAT A 9600, 13. 7, 3600, 390, 25000 DAT A 9600, 9. 6, 3300, 80, 12000 DAT A 9400, 11. 4, 4000, 100, 13000 END DAT A. FACT OR VAR= ALL.FACT OR 过程进行对 5 个变量的主成分分析。所有处理均按内定方式进行, 即提取特征 根大于 1 的主成分并进行方差极大法正交旋转, 输出结果如下:收稿日期: 19970908601998 年

5、第 2 期统计与信息论坛 Analysis number 1 Listwise deletion of cases with missing values Extraction 1 for analy-sis 1, Principal Components Analysis( PC) Initial Statistics:VariableCommunality*FactorEigenvaluePct of VarCum PctX11. 00000*12. 8733157. 557. 5X21. 00000*21. 7966635. 993. 4X31. 00000*3. 214844. 397

6、. 7X41. 00000*4. 099932. 099. 7X51. 00000*5. 01526. 3100. 0基于过程内定取特征大于 1 的规则, FACT OR 过程提取了两个主分量, 提取两个主分量相应的载荷阵见下表:Factor Matrix:Factor 1Factor 2X1. 58096. 80642X2. 76704- . 54476X3. 67243. 72605X4. 93239- . 10431X5. 79116- . 55818上表给出的是对原始数据 X 和主成分均已标准化处理后的前两个所提取的主成分的截 荷阵。设有 Y1、 Y2 分别代表第一、 第二主成分, 则

7、由截荷阵有:Y1= 0. 58096X1+ 0. 76704X2+ 0. 67243X3+ 0. 93239X4+ 0. 79116X5Y2= 0. 80642X1- 0. 54476X2+ 0. 72605X3- 0. 10431X4- 0. 55818X5 分析可知, 第一主成分 Y1 对全部 5 个变量都具有大的载荷, 它与收入 X4 有特别高的相关性。第二个变量 Y2 中, X1( 0. 80642) 和 X3( 0. 72605) 与 X2( - 0. 54476) 和 X5( - 0. 55818) 形成鲜明地对照, 而在 X4( - 0. 11431) 上有一个很小的载荷, 两主

8、成分对各个变量的解释程度见下表:Final Statistics:VariableCommunality*FactorEigenvaluePct of VarCum PctX1. 98783*12. 8733157. 557. 5X2. 88511*21. 7966635. 993. 4X3. 97931*X4. 88024*X5. 93750*从上表反映的各个变量的主成分方差可看出: 全部变量很好地被两个主成分解释, 因为各变量的主成分方差在 0. 88024 至 0. 98783 之间。 以上为 统计分析软件 SPSS/ PC+ 书上第 213215 页所举的主成分分析的例子, 下面虽 然

9、还有对该例的载荷阵进行正交旋转、 进行因子分析的步骤, 但如不进行旋转, 人们容易理解611998 年第 2 期统计与信息论坛 成以上就是主成分分析的步骤。二、 主成分分析和因子分析的区别主成分分析是把多个指标化为少数几个综合指标的统计分析方法。它找出几个综合因子( 主成分) 来代表原来众多的变量, 使这些综合因子尽可能地反映原来变量的信息量, 而且彼此 之间互不相关。主成分分析的步骤是:设有n 个单位 p 项指标的资料如下:X =X11X12X1pX21X22X2p Xn1Xn2Xnp( 一) 将原始数据进行标准化处理Zij=Xij- Xj Sji = 1, 2, n; j = 1, 2 p

10、其中Xj=1 n?ni= 1Xij为第 j 个变量的均值; S2j=1 n- 1?ni= 1( Xij- Xj)2为第 j 个变量的样本方差。( 二) 计算相关系数矩阵 RR = ( rij)pxp, 其中 rij=1 n - 1 ?ni= 1ZkiZkj i = 1, 2, p , j = 1, 2, p( 三) 求相关系数矩阵 R 的特征向量 U= ( uij)px p和特征值 ?1?2?p0 R 的特征方程式为?R- ? I?= 0, 特征值 ?g= ( g= 1, 2, p) 是主分量 F 的方差, 它的大小 反映了各个主分量在描述被评价对象上所起的作用大小。特征值 ?g所对应的特征向

11、量 Ug由方程组 R- ?g Ug= 0 求出, 即标准化向量 Zj在新坐标系下各分量上的系数。 主分量是原变量的线性组合Fi=?pj= 1UijZji = 1, 2, p( 1)( 四) 确定主分量个数的判定准则?g= ?g/ ?pg= 1?g表明每个分量说明原始变量的信息量, 即方差贡献率。对事先给定的累计方差贡献率q0( 通常取 0. 85) , 如果?k- 1i= 1?i/ ?pi= 1?i q0 ?ki= 1?i/ ?pi= 1?i( 2) 则可以取前 k 个主成分进行分析和评价。因子分析法研究相关矩阵的内部依赖关系, 它将多个变量综合为少数几个因子, 得出一个 较易揭示事物内部联系

12、的因子负荷矩阵, 以再现原始变量与因子之间的相关关系。因子分析的步骤是:1. 将原始数据进行标准化处理; 2. 计算相关系数矩阵 R;3. 求相关系数矩阵 R 的特征向量U= ( Uij)pxp和特征值 ?1?2?p0;621998 年第 2 期统计与信息论坛 4. 确定公共因子个数, 设为 k 个; 以上四步与主成分分析的前四步是完全相同的。5. 求解初始因子载荷矩阵 A= ( aij)pxp= ( uij?j)pxp, 式中 U= ( uij)pxp为 R 的特征向量; 6. 建立因子模型Zi=?kj = 1aijFj+ ai?i i = 1, p( 3)式中F1, Fk是公共因子, ?是

13、特殊因子; 7. 对初始因子载荷矩阵进行旋转变换, 旋转变换是使初始因子载荷矩阵结构简化, 关系明 确。 如果初始因子间不相关, 可采用方差极大正交旋转, 如果因子之间有相关关系, 需进行斜交旋转, 通过旋转后, 得到比较理想的新的因子载荷矩阵 A1= ( aij )pxk; 8. 将因子变为变量的线性组合Fi=?kj = 1bijZij i = 1, k( 4)式中回归系数 b 通过最小二乘解得到 BTAT1R- 1。由于因子分析是主成分分析的推广和发展, 这两种方法有许多相同之处, 如两种方法都需 要对原变量数据进行标准化处理; 两种方法都将原来相关的变量分解为互不相关的公共因子,这两种方

14、法都是将众多的变量综合为少数几个公共因子( 主成分) , 从而减少评价指标的维数, 以减少评价工作量; 两种方法中因子( 或主成分) 与变量之间都是线性关系; 两种方法的前面几个计算步骤基本相同等等。 主成分分析和因子分析又有很大的区别, 两者的主要区别是: 1. 主成分分析的数学模型实质上是一种变换, 每个主成分对应的系数 Uij是唯一确定的;因子分析模型是描述原指标协方差结构的一种模型, 每个因子相应的系数不是唯一的。2. 主成分分析是将主成分表示为原观测变量的线性组合, Fi= ?pj= 1UijZj, 见( 1) 。而在因子分析模型中, 原变量是新因子的线性组合,Zi= ?ki= 1a

15、ijFj+ ai?i i= 1, p 见( 3) 。3. 因子的经济意义比主成分更明确。在主成分分析模型中, 主成分表示为每个变量的线 性组合, 每个主成分主要反映哪几个变量, 其意义并不十分明确; 而在因子分析中, 不仅要找出主因子, 更主要的是要知道每个主因子的意义, 为此需对因子载荷矩阵施行旋转, 使得因子载 荷的平方按列向 0 和 1 两极转化, 旋转后每个因子主要由哪些变量决定, 其意义更加明确。从以上比较可以看出, 在主成分分析模型中, 原变量是自变量, 主成分是因变量, 主成分是 用 Uij作为系数对标准化的原变量进行组合; 而在用 SPSS 进行因子分析时, 用主成分法提取因子

16、得到因子载荷阵 A= ( aij)pxp= Uij?j)pxp后, 建立的因子模型原变量是因变量, 因子是自变量。 因此, 将因子表示成变量的组合, Fi= ?pj= 1aijZj, 并称Fi为主成分, 并不是主成分模型。 这种表示是错误的。所以, 用 SPSS 软件不能直接进行主成分分析。三、 怎样用 SPSS 软件进行主成分分析实际上, 根据特征向量 U= ( uij)pxp和因子载荷阵 A= ( aij)pxp的关系, 可以用 SPSS 软件进631998 年第 2 期统计与信息论坛 行主成分分析, 其步骤如下: 1. 用 FACT OR 命令, 用 PC( 主成分法) 提取因子, 得到因子载荷阵 A;2. 根据 A= ( aij)pxp= ( uij?j)pxp的关系, 可求出特征向量。uij= aij/?j( 5)3. 建立主成分模型 Fi= ?pj= 1uijZj i= 1, 2, k用 统计分析软件 SPSS/ PC+ 一书第 213- 21

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号