SPSS软件进行主成分分析的应用例子

资源描述

《SPSS软件进行主成分分析的应用例子》由会员分享，可在线阅读，更多相关《SPSS软件进行主成分分析的应用例子（10页珍藏版）》请在金锄头文库上搜索。

1、SPSS软件进行主成分分析的应用例子2002年16家上市公司4项指标的数据见表2,定量综合赢利能力分析如下:表2 2002年16家上市公司4项指标的数据公司销售净利率（X,）资产净利率（X ）净资产收益率（X3 ）销售毛利率（XJ歌华有线43.317.398.7354.89五粮液17.1112.1317.2944.25用友软件21.116.037.0089.37太太药业29.558.6210.1373浙江阳光11.008.4111.8325.22烟台万华17.6313.8615.4136.44方正科技2.734.2217.169.96红河光明29.115.446.0956.26贵州茅台20.2

2、99.4812.9782.23中铁二局3.994.649.3513.04红星发展22.6511.1314.350.51伊利股份4.437.3014.3629.04青岛海尔5.408.9012.5365.5湖北宜化7.062.795.2419.79雅戈尔19.8210.5318.5542.04福建南纸7.262.996.9922.721主成分分析的做法第一，将EXCEL中的原始数据导入到SPSS软件中;导入Spss的数据不能出现空缺的现象，如出现可用 0补齐。第二，对四个指标进行标准化处理；1 “分析”1“描述统计”1“描述”。2 弹出“描述统计”对话框，首先将准备标准化的变量移入变量组中，此时

3、，最重要的一步就是勾选“将标准化得分另存为变量”，最后点击确定。3 返回SPSS的“数据视图”，此时就可以看到新增了标准化后数据的字段。所做工作：a.原始数据的标准化处理数据标准化主要功能就是消除变量间的量纲尖系，从而使数据具有可比性，可以举个简单的例子，一个百分制的变量与一个5分值的变量在一起怎么比较？只有通过数据标准化，都把它们标准到同一个标准时才具有可比性，一般标准化采用的是Z标准化，即均值为0，方差为1,当然也有其他标准化，比如0-1标准化等等，可根据自己的研究目的进行选择，这里介绍怎么进行数据的Z标准化。所的结论：标准化后的所有指标数据。注意:SPSS在调用Factor Ana

4、lyze云程进行分析时，SPSS会自动对原始数据进行标准化处理，所以在得到计算结果后的变量都是指经过标准化处理后的变量，但SPSS并不直接给出标准化后的数据，如需要得到标准化数据，则需调用Descriptives过程进行计算。一第三，并把标准化后的数据保存在数据编辑窗口中然后利用进行因子分析（指标之间的相尖性判定略）。“因子分析”选项卡，将要进行分析的变量选入“变量”歹IJ1 “分析”“降维”SPSS的factor过程对数据一【3】设置抽，勾选碎石图”复选框；取”，勾选“最大方差法”复选框；【5】设置“得分，勾选“保存为变量”和“因子得分系数”复选框；6】查看分析结果。所做工作：a.查看K

5、MO和Bartlett的检验KMO直接近1 .KMO值越接近于1,意味着变量间的相尖性越强，原有变量越适合作因子分析；Bartlett球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相矣矢系。所的结论：析。符合因子分析的条件，可以进行因子分析，并进一步完成主成分分注意：1. KMO (Kaiser-Meyer-Olkin)KMO统计量是取值在0和1之间。当所有变量间的简单相笑系数平方和远远大于偏相尖系数平方和时，KMO值接近1. KMO值越接近于1,意味着变量间的相尖性越强，原有变量越适合作因子分析；当所有变量间的简单相尖系数平方和接近0时，KMO直接近O.KM。值越接近

6、于0,意味着变量间的相尖性越弱，原有变量越不适合作因子分析。Kaiser给出了常用的kmo度量标准：0.9以上表示非常适合；0.8表示适合；0.7表示一般；0.6表示不太适合；0.5以下表示极不适合。2. Bartlet七球度检验：巴特利特球度检验的统计量是根据相尖系数矩阵的行列式得到的，如果该值较大，且其对应的相伴概率值小于用户心中的显著性水平，那么应该拒绝零假设，认为相尖系数矩阵不可能是单位阵，即原始变量之间存在相尖性，适合于做主成份分析；相反，如果该统计量比较小，且其相对应的相伴概率大于显著性水平，则不能拒绝零假设，认为相尖系数矩阵可能是单位阵，不宜于做因子分析。Bartlett

7、球度检验的原假设为相尖系数矩阵为单位矩阵，Sig值为0.001小于显著水平0.05,因此拒绝原假设，说明变量之间存在相矢矢系，适合做因子分析。所做工作：b.全部解释方差或者解释的总方差(Total Varianee Explained)初始特征根(Initial Eigenvalues)大于1，并且累计百分比达到80%85%以上。查看相尖系数矩阵的特征根及方差贡献率见表 3,由于前2个主成分贡献率85%结合表4中变量不出现丢失，所以提取的主成分个数m=2所的结论：初始特征根：入1=1.897入2=1.550主成分贡献率：r i=0.47429 r 2=0.38740注意：主成分的数目可以根据相

8、尖系数矩阵的特征根来判定，如前所说，相尖系数矩阵的特征根刚好等于主成分的方差，而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的准则有三：1. 只取入1的特征根对应的主成分从Total Varianee Explained表中可见，第一、第二和第三个主成分对应的入值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。2. 累计百分比达到80% 85%以上的入值对应的主成分在Total Varianee Explained表可以看出，前三个主成分对应的入值累计百分比达到89.584%，这暗示只要选取三个主成分，信息量就够了。3. 根据特征根变化的突

9、变点决定主成分的数量从特征根分布的折线图（Scree Plot ）上可以看到，第4个入值是一个明显的折点，这暗示选取的主成分数目应有pw4。那么，究竟是3 个还是4个呢？根据前面两条准则，选3个大致合适（但小有问题）。第四，计算特征向量矩阵（主成分表达式的系数）【1】将初始因子载荷矩阵中的两列数据输入（可用复制粘贴的方法）到数据编辑窗口（为变量 VI、V2）;F 匚 V/SQR （入 1）【2】然后利用“转换”|“计算变量，打开“计算变量对话框，在“目标变量文本框中输入 “ F，然后在数字表达式中输入“ WSQR （入J ”注：入1=1.897,gp可得到特征向量Fi ;【3】然后利用“转换

10、”|“计算变量”，打开“计算变量对话框，在“目标变量文本框中输入 “肱，然后在数字表达式中输入“ V/SQR （入J ”注：入1=1.550,IP可得到特征向量F2 ;【4】最后得到特征向量矩阵（主成分表达式的系数）。所做工作：a成分矩阵或者初始因子载荷矩阵（Component Matrix ）初始因子载荷矩阵见上图，通过初始因子载荷矩阵还不能得出主成分的表达式，还需要把初始因子载荷矩阵中的每列的系数（主成分的载荷）除以其相应主成分的特征根的平方根后才能得到主成分系数向量（主成分的得出系数）；所的结论：1. 用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。2. 计算后、得到的主成

11、分表达式的系数矩阵。1- 主成分表达式的系数提取出来的全部主成分可以基本反映全部指标的信息，但这些新变量（主成分）的表达却不能从输出窗口中直接得到，即：主成分中每个指标所对应的系数不是初始因子载荷矩阵中的对应指标的载荷，因为“Component Matrix ”是指初始因子载荷矩阵，每一个载荷量表示主成分与对应变量的相矢系数。2- 主成分表达式系数的计算方法初始因子载荷矩阵或主成分载荷矩阵（Compo nent Matrix）中的数据除以主成分相对应的特征根（或特征值）开平方根便得到两个主成分中每个指标所对应的系数。R=Vi/SQR （入 1）3. 主成分的指标划分与命名初始因子载荷矩阵或主成

12、分载荷矩阵（Comp onent Matrix）中每列表示相应主成分与对应变量的相矢系数，每个主成分所反映的原始指标各有不同，为进一步明确每个主成分侧重反应的具体原始指标，需要对原始指标在每个主成分上的载荷进行比较，其中载荷越大，其对应的主成分反映该原始指标的信息量越大，反之亦然；如果某一原始指标在几个主成分的载荷绝对值不相上下，归类比较含混，导致主成分的原始指标划分不清。说明有必要作进一步的因子分析。从Component Matrix即主成分载荷表中可以看出，哪源始指标在哪注成分上载荷绝对值较大亦即与该主成分的相矢系数较高【注：相矢分为正负相矢】。第五，计算主成分得分矩阵（主成分得分）

13、【1】将得到的特征向量与标准化后的数据相乘，然后就可以得出主成分函数的表达式；乙二 F n*zX i+ F i2*zX2+ F n*zX 3+ F JzX 4乙二FzX i+ F22*zX2+ F 23*zX 3+ FzX4（其中，zX为标准化后的数据）【2】然后利用“转换I “计算变量，打开“计算变量对话框，在“目标变量”文本框Tnuz ， 7iwi工父人。touz j / h i :j i / 1 . = j j jy/ /tt i u i /+0.261 *Z（净资产收益率）+0.546它（销售毛利率）”注:Fi=0.531,0.594,0.261,0.546，即可得至I特征向量乙；3同

14、理注:F2 二 0.412，0.404，0.720，-0.383 ,可得到特征向量乙；【4】求出16家上市公司的主成分值。所做工作：a.对原始数据标准化后的数据标准化后的数据；所的结论：1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。（其中，Z%为标准化后的数据）第六，最后利用主成分函数、综合主成分公式：11】将得到的特征向量与标准化后的数据相乘，然后就可以得出主成分表达式;Z=r J Z汁r忆【2】然后利用“转换”“计算变量”，打开“计算变量”对话框，在“目标变量”文本框中输入“2，”然后衽数字表达式中输入“计乙+/乙”注:r 1=0.47429,洱0.3874，即可得到综合主成分； 13综合主成分（赢利能力）值。所做工作：a.对原始数据标准化后的数据标准化后的数据;所的结论：1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。注意：1综合主成分得分的计算方法Z=F乙+分乙（乙综合主成分得分；门：主成分贡献率；z：主成分i得分）表5.主成分、综合主成分（赢利能力）值

展开阅读全文