主成分分析在SPSS中的操作应用(详细步骤

上传人:m**** 文档编号:542246324 上传时间:2023-04-05 格式:DOCX 页数:8 大小:98KB
返回 下载 相关 举报
主成分分析在SPSS中的操作应用(详细步骤_第1页
第1页 / 共8页
主成分分析在SPSS中的操作应用(详细步骤_第2页
第2页 / 共8页
主成分分析在SPSS中的操作应用(详细步骤_第3页
第3页 / 共8页
主成分分析在SPSS中的操作应用(详细步骤_第4页
第4页 / 共8页
主成分分析在SPSS中的操作应用(详细步骤_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《主成分分析在SPSS中的操作应用(详细步骤》由会员分享,可在线阅读,更多相关《主成分分析在SPSS中的操作应用(详细步骤(8页珍藏版)》请在金锄头文库上搜索。

1、主成分分析在SPSS中的操作应用(1)一、引言主成分分析和因子分析在社会经济统计综合评价中是两个常被使用的统计 分析方法。现在SPSS、SAS等统计软件使用越来越普遍,但SPSS并未像SAS 一 样,将主成分分析与因子分析作为两个独立的方法并列处理注:主成分分析与 因子分析二者是又有着区别与联系,最主要的不同在于它们的数学模型的构建 上,具体区别请见参考文献2,而是根据二者之间的关系有机地将主成分分析 嵌入到因子分析之中,这样虽然简化了分析程序,却为主成分分析的计算带来不 便。且国内许多SPSS教程并没有详细讲解如果应用SPSS进行主成分分析,如何 使用SPSS对主成分分析进行计算呢?为使读者

2、能够正确使用SPSS软件进行主成 分分析,本文将通过一个实例来详细介绍如何用SPSS做主成分分析。接下来先 简单介绍主成分分析原理与模型,以便读者对主成分分析有个大致的了解。二、主成分分析原理和模型1一)主分成分析原理主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合 成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原 来p个指标作线性组合,作为新的综合指标。最经典的做法就是用f(选取的第 一个线性组合,即第一个综合指标)的方差来表达,即Var(F)越大;表示F包 含的信息越多。因此在所有的线性组合中选取的F应该是方差最大的,故称F 为第一主成分。如果第一主

3、成分不足以代表原来P1个指标的信息,再考虑选取 1 F即选第二个线性组合,为了有效地反映原来信息,F已有的信息就不需要再出 21现再F中,用数学语言表达就是要求Cov(F , F)=0,则称F为第二主成分,依 2 1 2 2此类推可以构造出第三、第四,第P个主成分。(二)主成分分析数学模型F2=ai2ZXi+a22ZX2+ap2ZXpF=a ZX+a ZX +a ZXp 1m 1 2m 2 pm p其中a , a ,a (i=l,m)为X的协方差阵工的特征值多对应的1i 2i pi特征向量,ZX, ZX ,ZXp是原始变量经过标准化处理的值,因为在实际12应用中,往往存在指标的量纲不同,所以在

4、计算之前须先消除量纲的影响,而将 原始数据标准化,本文所采用的数据就存在量纲影响注:本文指的数据标准化 是指Z标准化。A=(a ) =(a ,a,a ,), Ra二入a , R为相关系数矩阵,入、a是相应的特征值 和单位特征向量,入 入鼻弍1 $0。111 2 p进行主成分分析主要步骤如下:1. 指标数据标准化(SPSS软件自动执行);2. 指标之间的相关性判定;3. 确定主成分个数m;4. 主成分F表达式;15. 主成分F命名;1主成分与综合主成分(评价)值。主成分分析在SPSS中的操作应用(2)图表1沿海3个省市经济数据人均创尸农业増加 值工业増加 值第三产业増加值固走费产 揽資基斗建设

5、投责社会洎费 品娶售总 靈海关出口总靈地方财政收人5458.21300014883.31376.22258.41315.5292258.4123.7399.7105501164313303502.538512288. 71070.73181.211.1610.26076.69047950.21406.T2092.61161.657. 11S68.345. 9302.32022.6E20&663. 9622. 860703.7361. 9941.4115.7171.S106361439TUZZ.63536.339&T.223Z01141.33215.B384.7643.75406.S406276

6、6. 22196.22755.8170.2779. 32035.2320.57097670165T06802356.530652296. 61180.6287T.5294.2566.94682135106631047.11859964.5曲T. 91663.3173.7272.9UTT0150301023.94224.64793. B302Z. g1275.55013 61843. 712022437.25062591.4367M5. 7542.2352. 71025.515. 1186.7(二)主成分分析在SPSS中的具体操作步骤运用SPSS统计分析软件Factor过程对沿海10个省市经济综

7、合指标进行主成分分 析。具体操作步骤如下:1. AnalyzedData ReductiondFactor Analysis,弹出 Factor Analysis 对话框2. 把XXo选入Variables框3. Descriptives: Correlation Matrix 框组中选中 Coefficients, 然后点击 Continue, 返回 Factor Analysis 对话框4. 点击“ OK”图表 2 Factor Analyze 对话框与 Descriptives 子对话框AMtlZ. fGDPU均*衣业斷IB IX可 匸库町 承三尸业垢加币I 融窗I严乂曲朋 个握本連设址

8、済阿 条1+mii常泉址I迢广 BnaoiicedI nii-nuQeLHO arc Badlellt test el 豹heiic如SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化 处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直 接给出标准化后的数据,如需要得到标准化数据,则需调用 Descriptives 过程进行计算图表 3 相关系数矩阵CgiTElzitiDn Midlrbc人沟GW工盛罐 iu-is舞工产业严段茨社佥活娈昂滌关出翻01&AOOP1.000-.D5HMM2如.9799J321.941.$37期

9、临AftCDP-J0WI.4K-.mIISAH214XW3W30SI3?3很业壇励怕-.CJi-.m1.000-.131-.AM-J09S-.114.011皿血(1工业壇加槓J967.133.B21.000S95&3J35.T05.&99弟三严辿蜉別理?19iso96SL4K)阳9*9J14$13困定茨产祝浹J14-.08J63.9731.000期.S3?.71(2?.3.Q 1J6郵.S40J9111.000.8SJ.624加】-.043JO 1393S咖1.中护离寰出邕駆J5WMlAIS505.?14.TI7.tfa.55&l.OOfl-SS2蠣方则酸收山.373S9S.93鼻34J&48

10、弼uooa图表 4 方差分解主成分提取分析表Total Vaiiaiuce Ebhinjed丘血&1 Eiga-LTnitiiHCEmiliuTL Suni of SijiiTPii L匚应dingfI細% CfVOiiCiTlCuh泌竝悅1?.22072.20572.20J7.22072.20572.20521.2351234684.5511.2351234684.J513.8778.76993.3194.5475.46698.78*55.0S5別499.6406.021.21199.8501.012.11999.9708.002.01399.98S9.001.012100.OOC10.00

11、0.000100.000曲tr曲阳 Method:毎U 卿诚毗 齟卵if,主成分分析在 SPSS 中的操作应用(3) 图表 5 初始因子载荷矩阵Conqionent Matrix1Component12GDP.949.195人均GDP.112-.S24农业増加值-.109.677工业増加佰.978-.005第三产业増加值.986.070固定资产投资.983-.0阴基本連设投资.947-.024社会消费品零售总颔.977.176海关出口总颔.SOO-.051地方财政收入.954-.125Extraction Method: Piiiicip.al CcmponHiit An-alysis.:i-

12、 2 cutifiurLPfiis eMrarted.从图表3 可知 GDP 与工业增加值,第三产业增加值、固定资产投资、基本建 设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明 他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于 1 的前 m 个主成分。注:特 征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小 于 1 ,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大, 因此一般可以用特征值大于 1 作为纳入标准。通过图表4(方差分解主成分提取 分

13、析)可知,提取2个主成分,即m=2,从图表5 (初始因子载荷矩阵)可知GDP、 工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售 总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成 分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较 高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所 以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代 替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为 “Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应 变量的相关系数。用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根 便得到两个主成分中每个指标所对应的系数2。将初始因子载荷矩阵中的两列数 据输入(可用复制粘贴的方法)到数据编辑窗口(为变量Bl、B2),然后利用“TransformdCompute Variable,在 Compute Variable 对话框中输入 “A1=B1/SQR(7.22)” 注:第二主成分SQR后的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号