《主成分因子分析步骤》由会员分享,可在线阅读,更多相关《主成分因子分析步骤(5页珍藏版)》请在金锄头文库上搜索。
1、本文格式为Word版,下载可任意编辑主成分因子分析步骤 主成分分析、因子分析步骤 不同点 概念 主成分分析 因子分析 具有相关关系的p个变量,经过将原数据中多个可能相关的变量综合成少数几线性组合后成为k个不相关的新个不相关的可反映原始变量的绝大多数信息的变量 综合变量 裁减变量个数,以较少的主成分来解释原有变量间的大片面变异,适合于数据简化 找寻变量间的内部相关性及潜在的共同因素,适合做数据布局检测 主要 目标 强调 重点 最终结果应用 变异解释程度 是否需要旋转 是否有假设 强调的是解释数据变异的才能,强调的是变量之间的相关性,以协方差为导向,以方差为导向,使方差达成最大 关切每个变量与其他
2、变量共同享有片面的大小 形成一个或数个总指标变量 它将全体的变量的变异都考虑在内,因而没有误差项 主成分分析作综合指标用, 不需要旋转 只是对数据作变换,故不需要假设 反映变量间潜在或查看不到的因素 只考虑每一题与其他题目共同享有的变异,因而有误差项,叫独特因素 因子分析需要经过旋转才能对因子作命名与解释 因子分析对资料要求需符合大量假设,假设假设条件不符,那么因子分析的结果将受到质疑 因子分析 1 【分析】【降维】【因子分析】 (1)描述性统计量(Descriptives)对话框设置 KMO和Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)。 (2)因子抽取(Ex
3、traction)对话框设置 方法:默认主成分法。主成分分析确定要选主成分法 分析:主成分分析:相关性矩阵。 输出:为旋转的因子图 抽取:默认选1. 最大收敛性迭代次数:默认25. (3)因子旋转(Rotation)对话框设置 因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。 (4)因子得分(Scores)对话框设置 “保存为变量”,那么可将新建立的因子得分储存至数据文件中,并产生新的变量名称。 (5)选项(Options)对话框设置 2 结果分析 (1)KMO及Bartletts检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度
4、量。 Bartlett 的球形度检验 近似卡方 df Sig. .515 3.784 6 .706 当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。根据Kaiser的观 点,当KMO0.9(很棒)、KMO0.8(很好)、KMO0.7(中等)、KMO0.6(普遍)、KMO0.5(粗劣)、KMO0.5(不能采纳)。 (2)公因子方差 公因子方差 卫生 饭量 等待时间 味道 亲切 起始 1.000 1.000 1.000 1.000 1.000 撷取 .855 .846 .819 .919 .608 撷取方法:主体元件分析。 Communalities(称共同度)表示公因子对各个变量能
5、说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的凭借程度越大。共同度低说明在因子中的重要度低。一般的基准是0.4就可以认为是对比低,这时变量在分析中去掉对比好。 (3)解释的总方差 说明的变异数总计 各因子的特征值 元件 1 2 3 4 5 总计 2.451 1.595 .662 .191 .100 变异的 % 49.024 31.899 13.246 3.823 2.008 累加 % 49.024 80.923 94.168 97.992 100.000 总计 2.451 1.595 因子付出率 变异的 % 49.024 31.89
6、9 累加 % 49.024 80.923 总计 2.042 2.004 因子累积付出率 变异的 % 40.843 40.079 累加 % 40.843 80.923 撷取方法:主体元件分析。 其次列:各因子的统计值 第三列:各因子特征值与全体特征值总和之比的百分比。也称因子付出率。 第四列:累积百分比也称因子累积付出率 其次列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列%是各因子的特征值与全体因子的特征值总和的比,也称因子付出率;第四列是因子累计付出率。 如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。因
7、子1的付出率为49.0%,因子2的付出率为31.899%,这两个因子付出率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维对比显著。 至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1,即为因子得分。 (4)成分矩阵与旋转成分矩阵 成分矩阵是未旋转前的因子矩阵,从该表中并无法领会地看出每个变量毕竟应归属于哪个因子。旋转后的因子矩阵,从该表中可领会地看出每个变量毕竟应归属于哪个因子。此表显示旋转后原始的全体变量与新生的2个公因子之间的相关程度。 一般的,因子负荷量的十足值0.4以上,认为是显著的变量,超过0.5时可以说是分外重要的变量。如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。 (5)因子得分系数矩阵 元件评分系数矩阵 元件 卫生 饭量 等待时间 1 -.010 .425 -.038 2 .447 -.036 .424 5