主成分分析及因子分析(管理统计学及SPSS160应用课件)

资源描述

《主成分分析及因子分析(管理统计学及SPSS160应用课件)》由会员分享，可在线阅读，更多相关《主成分分析及因子分析(管理统计学及SPSS160应用课件)（44页珍藏版）》请在金锄头文库上搜索。

1、管理统计学 2010年 11 主成分分析与因子分析 11 1 因子分析 11 1 1 因子分析的理论与方法 11 1 2 因子分析的SPSS应用 11 2 主成分分析 11 2 1 主成分分析的理论与方法 11 2 2 主成分分析的SPSS应用 11 1 因子分析因子基础变量既能包含原来众多变量代表的信息又能解释这些变量相互依存关系的变量因子分析多元统计分析技术的一个分支用于处理多变量问题是一种降维简化数据的技术因子分析的应用寻求基本结构数据化简 11 1 1 因子分析的理论与方法因子分析的数学模型因子分析的有关概念因子负载公共因子方差因子的贡献因子

2、旋转解释因子因子得分因子分析的步骤因子分析的数学模型 F1 F2 Fm称为公共因子 i为Xi的特殊因子矩阵形式X AF 需满足 m p Cov F 0 且因子负载联系观测变量和公共因子的桥梁公共因子完全不相关时因子负载aij等于第i个变量和第j个因子之间的相关系数 aij的绝对值越大公共因子与观测变量关系越大公共因子彼此不相关时变量Xi与Xj的相关系数为比较观测数据计算出的相关系数和模型导出的变量的相关系数判断因子解是否合适差别很小模型很好的拟合观测数据因子解合适公共因子方差共同度观测变量的方差中由公共因子决定的比例说明用公共因子替代观测变量后原

3、来每个变量信息被保留的程度公共因子方差越大变量能够被因子说明的程度越高当公共因子彼此正交时公共因子方差等于和该变量有关的因子负载的平方和因子的贡献用因子所能够解释的总方差衡量的每个公共因子对变量的解释能力所有公共因子的总贡献为实际中相对指标更为常用即每个因子所解释的方差占所有变量总方差的比例Vp k K为观测变量的个数因子旋转因子结构因子和变量之间的相关关系因子模式因子负载矩阵因子旋转的条件一个变量在多个公共因子上有较大的负荷多个变量在同一个公共因子上有较大的负荷因子旋转的目的使同一个因子在各个变量上的负载尽可能的向靠近1 和靠近0的两极分离

4、因子旋转的方式正交旋转使因子轴之间仍然保持90度角因子之间仍旧不相关因子结构与因子模式等同斜交旋转因子之间的夹角是任意的因子负载不再等于因子和变量之间的相关系数因子模式与因子结构的关系为S BW S为因子结构矩阵 B 为因子负载矩阵 W为斜交因子之间的相关系数矩阵解释因子解释因子的作用借助因子负载矩阵找出在某个因子上有显著负载的变量根据这些变量的意义给因子一个合适的名称具有较高负载的变量对因子名称的影响较大解释因子的确定一般认为绝对值大于0 3的因子负载就是显著的因子得分因子得分的求解过程用观测变量的线性组合表示因子依据因子对应的每个变量的具体数

5、值进行测度因子得分的计算在因子分析模型中不考虑特殊因子的影响当m p且A可逆时该样本在因子F上的得分F A 1X 实际应用要求m p 只能对因子得分进行估计因子分析的步骤计算所有变量的相关系数矩阵提取因子确定因子的个数和求因子解的方法进行因子旋转使因子解的实际意义更容易解释计算因子得分 11 1 2 因子分析的SPSS应用添加分析变量描述性统计设置因子提取设置因子旋转设置因子得分设置缺失值及因子负载矩阵设置生育率影响因素分析变量设置 X1 Multi parity X2 Contraception X3 J school abo

6、ve X4 Average income 元 X5 Urban IdX1X2X3X4X5IdX1X2X3X4X5 10 9489 8964 51357773 08169 0488 7639 7188015 52 22 5892 3255 41298168 651712 0287 2838 76124828 91 313 4690 7138 2114819 081811 1589 1336 3397618 23 412 4690 0445 12112427 681922 4687 7238 38184536 77 58 9490 4641 83108036 122024 3484 8631 07

7、79815 1 62 890 1750 64201150 862133 2183 7939 44119324 05 78 9191 4346 32138342 65224 7890 5731 2690320 25 88 8290 7847 33162847 172321 5686 022 3865418 93 90 891 4762 36482266 232414 0980 9621 4995614 72 105 9490 3140 85169621 242532 3187 67 786512 59 112 692 4235 14171732 812611 1889 7141 0193021

8、49 127 0787 9729 5193317 92713 886 3329 6993822 04 1314 4488 7129 04131321 362825 3481 5631 3110027 35 1415 2489 4331 0594320 42920 8481 4534 59102425 72 153 1691 2137 85137227 343039 664 938 47137431 91 添加分析变量 Analyze Data Reduction Factor 选择变量选择参与分析的数据描述性统计设置输出原始变量的基本描述统计量输出因子分析的初始解简单相关系数矩阵相

9、关系数矩阵的逆矩阵显著性检验相关系数矩阵的行列式再生相关阵反映象相关矩阵 KMO和Bartlett球形检验因子提取设置 7 种因子提取方法默认为主成分分析法标准化后因子分析直接因子分析相关系数矩阵协方差矩阵输出旋转前的因子方差贡献表和因子负载矩阵输出因子碎石图设置提取的因子对应的特征跟范围默认值1 输入提取因子的个数 Principal components 主成分法把给定的一组相关变量通过线性变换转换成另一组不相关的变量新的变量按照方差递减的顺序排列总方差不变 Unweighted least squares 普通最小二乘法使因子模型计算出的相关系

10、数和观测到的相关系数之间的离差平方和最小 Genenralized least squares 广义最小二乘法用与 Unweighted least squares同样的原则迭代过程中用特殊因子方差倒数调整相关系数矩阵 Maximum likelihood 最大似然法类似广义最小二乘法使因子解最好拟合观测数据变量的相关关系假设样本来源于多维正态总体构造样本似然函数使其达到极大求解过程中相关系数用特殊因子方差倒数加权因子提取方法 Principal axis factoring 主轴因子法类似主成分法用公共因子方差代替相关系数矩阵主对角线上的元素1 新的矩阵称为调整相

11、关系数矩阵解调整相关系数矩阵的特征方程求得因子解 Alpha factoring 因子提取法变量是来自潜在变量空间中的样本通过给定的总体观测使提取的公共因子和假设存在的公共因子有最大的相关 Image analysis 映像分析法一个变量分解为两部分公共部分由除该变量外的观测变量线性组合预测即该变量的映像特有部分不能被其他变量线性组合预测即变量的反像同时考虑样本空间和变量空间映像的平方相当于公共因子方差反像的平方相当于特殊因子方差采用和主成分法类似的过程求得因子解因子提取方法续因子提取方法的选择通常各种方法产生的公共因子方差差别不大公共因子方

12、差为1时主成分法和其他6种方法的实质是一样的公共因子方差较低时差别比较明显主成分法解释变量的方差假设每个变量的方差能被完全解释相关系数矩阵主对角线上的元素和其他元素同样重要甚至更重要其他方法解释变量的相关关系假设观测变量的相关能完全被公共因子解释方差不一定能完全被公共因子解释不能被解释的方差只影响相关系数矩阵主对角线上的元素要求因子解能够拟合相关系数矩阵主对角线以外的元素提取相同数目的因子主成分法能够解释更多的方差变量个数增加主对角线上元素重要程度降低差异不再明显样本量很大时最大似然法解比其他解的精度有明显提高依据因子分析的目的和对变量方差了解程

13、度决定的方法要以最少的因子最大程度地解释原始数据中的方差或已明确特殊因子和误差带来的方差很小适合用主成分法为了确定数据结构但并不了解变量方差的情况适用其他6种方法因子旋转设置简化因子负载矩阵列使因子负载平方的方差最大直接斜交旋转法因子自相关的程度可尽量减少解释变量的因子个数 Varimax与Quartimax因子解加权平均速度比直接旋转法快适用于大样本输出旋转后的因子方差贡献表和因子负载矩阵输出旋转后因子负载散点图因子得分设置将因子值作为新变量保存在数据文件中计算因子得分的方法输出因子得分矩阵缺失值及因子负载矩阵设置缺失值处理方法因子负载矩阵显

14、示方式观测的所有分析变量有一个有缺失值就不参与分析只把两个变量协方差或相关系数带有缺失值的观测删除用均值替代缺失值按因子负载的大小排序不显示绝对值太小的因子负载变量共同度 KMO与Bartlett球形检验 Communalities InitialExtraction multi parity 1 000 887 contraception 1 000 913 J school above 1 000 860 average income1 000 878 urban 1 000 931 Extraction Method Principal Component Analys

15、is 共同度都在85 以上因子提取效果比较理想 KMO and Bartlett s Test Kaiser Meyer Olkin Measure of Sampling Adequacy 713 Bartlett s Test of SphericityApprox Chi Square106 776 df10 Sig 000 KMO统计量为0 713 Bartlett球形检验的值为0 000 说明案例数据比较适合因子分析相关系数矩阵及相关显著性检验 Correlation Matrix multi parity contraception J school above Averag

16、e income Urban Correlation multi parity 1 000 761 542 453 453 contraception 7611 000 293 253 245 J school above 542 2931 000 771 849 average income 453 253 7711 000 878 urban 453 245 849 8781 000 Sig 1 tailed multi parity 000 001 006 006 contraception 000 058 089 096 J school above 001 058 000 000 average income 006 089 000 000 urban 006 096 000 000 初始的样本相关系数矩阵或协差阵特征根特征根与方差贡献率表 Total Variance Explained Initial EigenvaluesExtraction Sums of Squared Loadings Rotation Sums of Squared Loadings Tota

展开阅读全文