SPSS进行主成分分析

上传人:平*** 文档编号:14289273 上传时间:2017-10-30 格式:DOC 页数:12 大小:375.64KB
返回 下载 相关 举报
SPSS进行主成分分析_第1页
第1页 / 共12页
SPSS进行主成分分析_第2页
第2页 / 共12页
SPSS进行主成分分析_第3页
第3页 / 共12页
SPSS进行主成分分析_第4页
第4页 / 共12页
SPSS进行主成分分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《SPSS进行主成分分析》由会员分享,可在线阅读,更多相关《SPSS进行主成分分析(12页珍藏版)》请在金锄头文库上搜索。

1、1利用 SPSS 进行主成分分析【例 1】 以全国 31 个省市的 8 项经济指标为例,进行主成分分析。第一步:录入或调入数据(图 1) 。图 1 原始数据(未经标准化)第二步:打开“因子分析”对话框。沿着主菜单的“AnalyzeData ReductionFactor ”的路径(图 2)打开因子分析选项框(图 3) 。图 2 打开因子分析对话框的路径2图 3 因子分析选项框第三步:选项设置。首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图 3) 。在本例中,全部 8 个变量都要用上,故全部调入(图 4) 。因无特殊需要,故不必理

2、会“Value ”栏。下面逐项设置。图 4 将变量移到变量栏以后 设置 Descriptives 选项。单击 Descriptives 按钮(图 4) ,弹出 Descriptives 对话框( 图 5) 。3图 5 描述选项框在 Statistics 栏中选中 Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考) ;选中 Initial solution复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用) 。在 Correlation Matrix 栏中,选中 Coefficients 复选项,则会

3、给出原始变量的相关系数矩阵(分析时可参考) ;选中 Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在 Excel 中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选) 。设置完成以后,单击 Continue 按钮完成设置(图 5) 。 设置 Extraction 选项。打开 Extraction 对话框(图 6) 。因子提取方法主要有 7 种,在 Method 栏中可以看到,系统默认的提取方法是主成分(Principal Components) ,因此对此栏不作变动,就是认可了主成分分析方法。在 Analyze 栏中,

4、选中 Correlation matrix 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中 Covariance matrix 复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。在 Display 栏中,选中 Unrotated factor solution(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。选中 Scree Plot(“山麓”图) ,则在分析结果中给出特征根按大小分布的

5、折线图(形如山麓截面,故得名) ,以便我们直观地判定因子的提取数量是否准确。在 Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues)的数值,系统默认的是 。我们知道,在主成分分析中,主成1c分得分的方差就是对应的特征根数值。如果默认 ,则所有方差大于等于 1 的主c成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将 值降低,c例如取 ;如果认为最后的提取的主成分数量偏多,则可以提高 值,例如取9.0c。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值1.的设定,要在反复试验以后才能决定。一般而言,在初次分析时

6、,最好降低特征根的4临界值(如取 ) ,这样提取的主成分将会偏多,根据初次分析的结果,在第8.0c二轮分析过程中可以调整特征根的大小。第二种方法是直接指定主成分的数目即因子数目,这要选中 Number of factors 复选项。主成分的数目选多少合适?开始我们并不十分清楚。因此,首次不妨将数值设大一些,但不能超过变量数目。本例有 8 个变量,因此,最大的主成分提取数目为 8,不得超过此数。在我们第一轮分析中,采用系统默认的方法提取主成分。图 6 提取对话框需要注意的是:主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是 25 次。但是,当数据量较大时,25 次迭代是不够

7、的,需要改为 50 次、100 次乃至更多。对于本例而言,变量较少,25 次迭代足够,故无需改动。设置完成以后,单击 Continue 按钮完成设置(图 6) 。 设置 Scores 设置。选中 Save as variables 栏,则分析结果中给出标准化的主成分得分(在数据表的后面) 。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归” (R egression)法即可。图 7 因子得分对话框5选中 Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。设置完成以后,单击 Continue 按

8、钮完成设置(图 7) 。 其它。对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option 项可以不必理会。全部设置完成以后,点击 OK 确定,SPSS 很快给出计算结果(图 8) 。图 8 主成分分析的结果第四步,结果解读。在因子分析结果(Output)中,首先给出的 Descriptive Statistics,第一列 Mean 对应的变量的算术平均值,计算公式为 nijjx1第二列 Std. Deviation 对应的是样本标准差,计算公式为 2/11)(nijijj x第三列 Analysis N 对应是样本数目。这一组数据在分析过程中可作参考。

9、6Descriptive Statistics1921.093 1474.80603 301745.933 861.64193 30511.5083 402.88548 305457.633 1310.21805 30666.1400 459.96699 30117.2867 2.02531 30114.9067 1.89808 30862.9980 584.58726 30业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业Mean Std. Deviation Analysis N接下来是Correlation Matrix(相关

10、系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式 可知,det(I)=det(R),从而0)det(RIDeterminant=1.133E-0.4=1*2*3*4*5*6*7*8。这一点在后面将会得到验证。Correlation Matrixa1.000 .267 .951 .191 .617 -.273 -.264 .874

11、.267 1.000 .426 .718 -.151 -.235 -.593 .363.951 .426 1.000 .400 .431 -.280 -.359 .792.191 .718 .400 1.000 -.356 -.135 -.539 .104.617 -.151 .431 -.356 1.000 -.253 .022 .659-.273 -.235 -.280 -.135 -.253 1.000 .763 -.125-.264 -.593 -.359 -.539 .022 .763 1.000 -.192.874 .363 .792 .104 .659 -.125 -.192 1

12、.000业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业Determinant = 1.133E-04a. 在Communalities中,给出了因子载荷阵的初始主成分方差(Initial)和提取主成分方差(Extraction),后面将会看到它们的含义。Communalities1.000 .9451.000 .8001.000 .9021.000 .8751.000 .8571.000 .9571.000 .9291.

13、000 .903业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业业 业 业 业Initial ExtractionExtraction Method: Principal Component Analysis.在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues(初始特征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数7矩阵的各个特征根,因此可以直接根据特征根计算每一个主成分的方差百分比(% of Variance)。由于全部特征根的总和等于变量数目,即有

14、m= i=8,故第一个特征根的方差百分比为 1/m=3.755/8=46.939,第二个特征根的百分比为 2/m=2.197/8= 27.459,其余依此类推。然后可以算出方差累计值(Cumulative %)。在Extraction Sums of Squared Loadings,给出了从左边栏目中提取的三个主成分及有关参数,提取的原则是满足1,这一点我们在图6所示的对话框中进行了限定。Total Variance Explained3.755 46.939 46.939 3.755 46.939 46.9392.197 27.459 74.398 2.197 27.459 74.3981

15、.215 15.186 89.584 1.215 15.186 89.584.402 5.031 94.615.213 2.660 97.275.138 1.724 98.9996.5E-02 .818 99.8171.5E-02 .183 100.000Component12345678Total % ofVariance Cumulative% Total % ofVariance Cumulative%Initial Eigenvalues Extraction Sums of Squared LoadingsExtraction Method: Principal Component

16、Analysis.Scree PlotComponent Number87654321Eigenvalue43210图8 特征根数值衰减折线图(山麓图)主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据值决定8主成分数目的准则有三:i 只取1的特征根对应的主成分从Total Variance Explained表中可见,第一、第二和第三个主成分对应的 值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。ii 累计百分比达到80%85%以上的值对应的主成分在Total Variance Explained表可以看出,前三个主成分对应的 值累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。iii 根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(Scree Plot

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号