单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2004-3-10,Exploratory Factor Analysis&SPSS Application,*,心理学研究方法第十三章演示,数据简化技术,探索性因素分析及SPSS应用,Data Reduction Technique,Exploratory Factor Analysis&SPSS Application,凤 四 海,2004-3-10,1,Exploratory Factor Analysis&SPSS Application,提 纲,第一节,因素分析原理概述,一、因素分析基本原理,二、因素分析模型及条件,三、SPSS因素分析功能选项,第二节 因素分析的步骤,一、数据适当性考察和因素数确定,二、求解因素模式,三、因素的解释和命名因子旋转,第三节 斜交旋转和因子值应用,一、因子相关时的旋转斜交旋转法,二、因子值的意义及应用,(可选讲),2004-3-10,2,Exploratory Factor Analysis&SPSS Application,因素分析的主要目的,心理学研究中的一些心理特质(如自我、人格、智力等)往往都是一些“潜在变量”,只能通过对一些可观测的“外显变量”的测量间接反应之。
用一般的多元统计方法往往使得对数据的分析和描述陷入混乱不仅如此,变量间的高度相关还会极大地削弱某些统计方法的效果数据化简技术:主成分分析,、对应分析、典型相关分析、多维量表法,等,因素分析主要针对等距,尺度变量,其主要目的,:,1.,通过寻找或确定几个较少的假想“因子”来反映多个观测变量中蕴含的大部分信息,从而浓缩或化简观测数据2.浓缩后的因子代表了数据间的基本结构,通过得到的因子估计值使研究者更方便地掌握数据的本质特质以及因子和观测变量之间的关系多重共线性”,返回,2004-3-10,3,Exploratory Factor Analysis&SPSS Application,因素分析的发展历程,思想基础:,包括启蒙运动,(,the Enlightenment,),在内的思潮对绝对论(,absolutism,)的批判:任何实体都可能不是它表现出的,模样,而是对其潜在现象的反映;符号主义(,Symbolism,)、表现主义(,Expressionism,)19世纪兴起的对机械唯物主义的批判,提倡宏观论发展历程:,最早,由,Karl Pearson(1901),引入;,最早,由,Charles Spearman,在创立其智力理论时应用;,Thurstone(1931),发展的,“,common factor theory”,是其重要的理论基础,,,1940s-1960s,是其发展的辉煌期,。
返回,2004-3-10,4,Exploratory Factor Analysis&SPSS Application,因素分析的发展历程,三种主要应用观点:,特质理论,(,Trait theory,):,Spearman,Thurstone,Cattell,回答:一组观测变量背后潜在的基本特质是什么?,Dust bowl empiricism,:,Godfrey Thompson,Henry Kaiser,回避了内容和理论,而关注应用,聚类分析(,Cluster analysis,):,Holzinger,Tyron,&Bailey,相信较低水平的观测(如项目)可以被整合成较高水平的具有理论价值的构念返回,2004-3-10,5,Exploratory Factor Analysis&SPSS Application,第一节,因素分析原理概述,Common Factor Theory及变异分解,题项1:我对我的薪水感到满意;,题项2:我对工作中的同事感到满意;,题项3:我对工作中的上司感到满意问题:我测量的是一个东西吗?,因素分析假设变量的变异可分解成三个部分:,公因子方差:各变量间的公共变异;,特殊因子方差:不能由公因子解释的、变量特有的变异;,误差方差:变量中不可信的、无法解释的变异;,三者间的关系,图示,:,2004-3-10,6,Exploratory Factor Analysis&SPSS Application,1,-h,2,指变量的变异中无法被公因子模型解释的部分比例,因素分析使用变量间的相关(标准化数据的协方差)系数来估计公因子及连接因子和变量间的结构关系(因素负荷)。
一,因素分析基本原理,公因子方差 特殊因子方差 误差方差,“工作满意度”“上司人格特征”“情绪”,可信的变异或“共同度”,h,2,独特变异,(1,-h,2,),公因子,F1,X,1,X,2,X,3,X,4,l,41,l,31,l,21,l,11,因子 F1“引起”或解释了题项1到4中的公共变异,l,41,指“变量4在因子1上的负荷”,返回,2004-3-10,7,Exploratory Factor Analysis&SPSS Application,主成分分析法(,principal component analysis,PCA,),:,一种独立于因素分析的数据化简方法,SPSS默认的分析方法用以寻找将变量以最优方式结合成少数几个成分,保持总变异,主成分数=变量数,主成分是变异的,几何抽象,,不一定复合真实情况信息保留较多主因子分析法(,common factor analysis,PFA or CFA,),:,假设公因子可以完全解释变量间的相关关系,而不一定能完全解释变量的变异(即不考虑特殊因子),用以确定变量背后的结构并估计因子得分,更符合实际情况通常在主成分分析的基础上进行,只分析公共变异。
常用于对变量方差不了解并不太考虑信息丢失的情况一,因素分析基本原理,简化数据,探索结构,2004-3-10,8,Exploratory Factor Analysis&SPSS Application,一,因素分析基本原理,将一组,相关,的观测变量转换成少数几个,不相关,的公因子,变换不改变变量的总方差,第一个主成分具有最大方差,随后抽取的主成分解释的数据变异量逐渐递减,如图13-1第一、第二主成分分别是椭圆长轴、短轴;变量的变异用不相关的主成分表示观测变量X、Y可表示为因子空间f,1,f,2,f,3,中的向量,向量长度即共同度,向量在三个因子轴上的投影称因素负荷,变量间相关系数等于两变量共同度与夹角余弦乘积,各变量的因素负荷、夹角由公因素方差、相关系数决定,所谓的“求因素解”无非是在空间中设置适当的坐标轴,2004-3-10,9,Exploratory Factor Analysis&SPSS Application,二 因素分析模型及条件,公因子理论:,p,个观测变量,相当于一份问卷中的,p,个题项,它是一个随机变量;不同被试都将有,p,个不同的数据;,m,个公因子,其值称因子值(,factor score,);,代表残差,包括特殊因子和误差,是各变量中不能用公因子解释的部分;系数,l,ij,称为因子负荷(,factor loading,),表示第,i,个变量在第,j,个因子上的相对重要性(权数)。
正交模型,因子间不相关,,斜交模型,因子间相关返回,2004-3-10,10,Exploratory Factor Analysis&SPSS Application,观测,变量标准化,变量和因素的均值均为,0,,方差均为,1;,公共因素和独特因素间不相关,各独特因素之间也不相关(尤其在公因子分析法中);,观测变量间线性相关,一般绝大部分应不低于,0.3,;,正交模型要求公因子之间相互独立,尤其是主成分分析中;,等距型数据,一些特殊情况下等级型数据也可以接受;,最好是多元正态数据,尤其极大似然法;,样本量越小,样本数据的分布和线性关系越需要加以检验,最好是100以上二 因素分析的假设条件,返回,2004-3-10,11,Exploratory Factor Analysis&SPSS Application,子对话框,功,能,选,项,Descriptives,提供观测变量、初始解及相关矩阵有关统计量,Statistics,Correlation Matrix,Extraction,提供因子抽取有关选项,Method Analyze Extract,Display,Maximum iterations for convergence,Rotation,提供因子旋转有关选项,Method Display,Maximum iterations for Convergence,Scores,提供因子值计算及处理选项,Save as variables Method,Display factor score coefficient matrix,Options,提供缺失值处理及显示格式选项,Missing values,Coefficient Display Format,三 SPSS,因素分析功能选项,返回,2004-3-10,12,Exploratory Factor Analysis&SPSS Application,第二节 因素分析步骤,筛选观测变量,样本数据适当性考察,确定因子数,求解因素模式,因子旋转,返回,因素分析适合度检验,参数估计,正交旋转,1.因素抽取,主成分法,主轴因子法,极大似然法,未旋转解,共同度,特征值,2.据碎石图,和特征值,确定因子数,3.因素旋转,方差最大法,平均正交法,斜交旋转,4.据简单结构解释或确定因子的含义,5.报告因素模式和因素结构,6.据结果调整旋转方法重复该过程至重复抽取过,程,2004-3-10,13,Exploratory Factor Analysis&SPSS Application,例,13-1,某研究者收集了,100,名被试对六种政策的回答数据,其中六个变量,col1col6,分别表示“政府应当投入更多的教育经费”、“政府应当投入更多的经费减少失业”、“政府应当控制大企业”、“政府应当通过用校车送孩子上学加速废止种族隔离”、“政府应当增加少数民族的工作配额”和“政府应当扩展领先计划”。
例子讲解,分析之前,先要将原相关矩阵补齐,然后在相关阵前面增加两列标示变量ROWTYPE_和VARNAME_,取值分别为CORR和6个变量名,再增加第一行数据,ROWTYPE_列取值N,VARNAME_留空,其它6列变量取值100表明样本量打开数据,在SPSS因素分析菜单中按正常模式选择变量及其它选项后将命令粘贴到语句文件中,并将第二行语句改成:,/MATRIX=IN(COR=*),2004-3-10,14,Exploratory Factor Analysis&SPSS Application,筛选观测变量,筛选观测变量是一个复杂的问题,它涉及到理论构想,,编制量表前开放式问卷项目的归纳整理和项目分析等模型中包含了无关的变量或者剔除了相关的变量可能极大地影响分析的结果以下观测变量最好不选入模型:,1、标准差低,,通常表现为观测变量中被试的反应趋同;,2、重测信度低(建议0.2);,3、最大负荷值,l,ij,小(建议0.4);,4、共同度,h,i,2,小(建议0.16);,5、最大负荷值,l,ij,与共同度,h,i,2,之比小(建议0.5);,6、最大两个负荷值,l,ij,与共同度,h,i,2,之比小(建议0.25);,7、取样适当性系数(,MSA,)过小;,8、多极变量,即一个变量在几个因子上的负荷都较大。
返回,2004-3-10,15,Exploratory Factor Analysis&SPSS Application,样本数据适当性考察,Bartlett,球度检验,(,Bartletts test of sphericity,),:,近似,2,检验,,H,o,:“相关矩阵是单位阵”,显然,其显著性水平要至少小于,0.05,,才能拒绝。