[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析

上传人:豆浆 文档编号:39499249 上传时间:2018-05-16 格式:PDF 页数:64 大小:2.40MB
返回 下载 相关 举报
[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析_第1页
第1页 / 共64页
[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析_第2页
第2页 / 共64页
[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析_第3页
第3页 / 共64页
[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析_第4页
第4页 / 共64页
[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析》由会员分享,可在线阅读,更多相关《[自然科学]贾俊平SPSS统计分析 第11章 主成分分析和因子分析(64页珍藏版)》请在金锄头文库上搜索。

1、作者贾俊平作者贾俊平统 计 学统 计 学 (第三版)(第三版)200811 - 2统计学统计学 STATISTICS (第三版第三版)2008年8月模型选择是艺术,而不是科学。William Navidi统计名言统计名言第第 11 章主成分分析和因子分析章主成分分析和因子分析11.1主成分分析主成分分析 11.2 因子分析因子分析11 - 4统计学统计学 STATISTICS (第三版第三版)2008年8月学习目标学习目标主成分分析和因子分析的基本原理主成分分析和因子分析的基本原理主成分分析和因子分析的异同主成分分析和因子分析的异同主成分分析和因子分析的数学模型主成分分析和因子分析的数学模型用

2、用SPSS进行主成分分析和因子分析进行主成分分析和因子分析用主成分分析和因子分析对实际问题进行 综合评价用主成分分析和因子分析对实际问题进行 综合评价11 - 5统计学统计学 STATISTICS (第三版第三版)2008年8月在研究实际问题时,往往需要收集多个变量。但这 样会使多个变量间存在较强的相关关系,即这些变 量间存在较多的信息重复,直接利用它们进行分析 ,不但模型复杂,还会因为变量间存在多重共线性 而引起较大的误差 为能够充分利用数据,通常希望用较少的新变量代 替原来较多的旧变量,同时要求这些新变量尽可能 反映原变量的信息 主成分分析和因子分子正式解决这类问题的有效方 法。它们能够提

3、取信息,使变量简化降维,从而使 问题更加简单直观主成分分析和因子分析主成分分析和因子分析 (Principal Component Analysis & Factor Analysis)11 - 6统计学统计学 STATISTICS (第三版第三版)2008年8月因子分析得到的是什么?因子分析得到的是什么?因子分析方法在部分领域应用的一些例子 心理学:心理学:心理学家瑟斯登对56项测验的得分进行因子分 析,得出了7中主要智利因子:词语理解能力,语言流畅 能力、计数能力、空间能力、记忆力、知觉速度和推理 能力 教育学:教育学:某师范大学在对以幼儿园36岁幼儿为对象, 通过80名幼儿教师对480名

4、幼儿好奇心行为特征描述的开 放式问卷调查,编制出60个项目的初始问卷,对500名幼 儿的初测结果进行探索性因子分析后,形成了33个项目 的正式问卷,对1000名幼儿的评价结果进行验证性因子 分析,结果表明:教师评价的36岁幼儿好奇心结构包 括敏感、对未知事物的关注、好问、喜欢摆弄、探索持 久和好奇体验6个因子11 - 7统计学统计学 STATISTICS (第三版第三版)2008年8月因子分析得到的是什么?因子分析得到的是什么?医学:医学:一位研究者对山东某县20002002年3年 的全死因调查资料中不同地区各恶性肿瘤标化死 亡率进行因子分析后发现,该县居民恶性肿瘤的 发病和死亡具有明显的地区

5、分布。在地区分布中, 各种恶性肿瘤的死亡具有一定程度的聚集性。经 因子分析得到的4个主因子可以解释10种恶性肿 瘤死亡率的74.54;10种恶性肿瘤中,被解释 的比例最小也在62以上;而胃癌、白血病、膀 胱癌、乳腺癌、结肠癌死亡率被解释的比例均在 77以上,表明这10种恶性肿瘤之间存在中等偏 强的内在联系和地区分布特点11 - 8统计学统计学 STATISTICS (第三版第三版)2008年8月因子分析得到的是什么?因子分析得到的是什么?地质学:地质学:海南岛的石绿铁矿及外围地区有透辉石透闪岩石和阳 起石两种岩石。地质工作者对两种岩石标本的11种化验数据进 行了因子分析,分别得到5种和4种主要

6、因子。结果表明,透辉 石透闪岩石与阳起石有明显区别,前者的元素组合属碳酸盐沉 积型,后者属岩浆分异型。透辉石透闪岩石中铁的沉积与泥质 成分有关,属于正常沉积。由此推断石绿铁矿的主要成矿为沉 积作用,并据此提出了找矿标志和找矿方向 上市公司评价:上市公司评价:某研究者选择35家能源类上市公司,根据 2007年的12项经营指标数据,采用因子分析法分别按盈利能 力、资产管理能力、偿债能力及经营业绩综合评分等方面对35 家上市公司进行了排名。其中:盈利能力排在前5位的是:神 火股份、海油工程、兰花科创、潞安环能和中国石油;经营业 绩综合得分排在前5位的是:神火股份、潞安环能、兰花科创、 海油工程和开滦

7、股份11.1 主成分分析主成分分析11.1.1主成分分析的基本原理主成分分析的基本原理 11.1.2主成分分析的数学模型主成分分析的数学模型 11.1.3主成分分析的步骤主成分分析的步骤第第 11 章主成分分析和因子分析章主成分分析和因子分析11.1.1 主成分分析的基本原理主成分分析的基本原理11.1 主成分分析主成分分析11 - 11统计学统计学 STATISTICS (第三版第三版)2008年8月主成分的概念由Karl Pearson在1901年提出 考察多个变量间相关性一种多元统计方法 研 究 如 何 通 过 少 数 几 个 主 成 分 (principal component)来解释

8、多个变量间的内部结构。即从 原始变量中导出少数几个主分量,使它们尽可能 多地保留原始变量的信息,且彼此间互不相关 主成分分析的目的:数据的压缩;数据的解释常被用来寻找判断事物或现象的综合指标,并对综 合指标所包含的信息进行适当的解释什么是主成分分析?什么是主成分分析? (principal component analysis)11 - 12统计学统计学 STATISTICS (第三版第三版)2008年8月对这两个相关变量所携带的信息(在统计上信息往往是 指数据的变异)进行浓缩处理 假定只有两个变量x1和x2,从散点图可见两个变量存 在相关关系,这意味着两个变量提供的信息有重叠主成分分析的基本

9、思想主成分分析的基本思想 (以两个变量为例以两个变量为例)如果把两个变量用 一个变量来表示, 同时这一个新的变 量又尽可能包含原 来的两个变量的信 息,这就是降维的 过程11 - 13统计学统计学 STATISTICS (第三版第三版)2008年8月椭圆中有一个长轴和一个短轴,称为主轴。在长轴方向,数据 的变化明显较大,而短轴方向变化则较小 如果沿着长轴方向设定一个新的坐标系,则新产生的两个变量 和原始变量间存在一定的数学换算关系,同时这两个新变量之 间彼此不相关,而且长轴变量携带了大部分的数据变化信息,而主成分分析的基本思想主成分分析的基本思想 (以两个变量为例以两个变量为例)短轴变量只携带

10、了一小 部分变化的信息(变异) 此时,只需要用长轴方 向的变量就可以代表原 来两个变量的信息。这 样也就把原来的两个变 量降维成了一个变量。 长短轴相差越大,降维 也就越合理11 - 14统计学统计学 STATISTICS (第三版第三版)2008年8月多维变量的情形类似,只不过是一个高维椭球,无法 直观地观察 每个变量都有一个坐标轴,所以有几个变量就有几主 轴。首先把椭球的各个主轴都找出来,再用代表大多 数数据信息的最长的几个轴作为新变量,这样,降维 过程也就完成了主成分分析的基本思想主成分分析的基本思想 (以两个变量为例以两个变量为例)找出的这些新变量 是原来变量的线性 组合,叫做主成分1

11、1.1.2 主成分分析的数学模型主成分分析的数学模型11.1 主成分分析主成分分析11 - 16统计学统计学 STATISTICS (第三版第三版)2008年8月数学上的处理是将原始的p个变量作线性组合,作为新的 变量 设p个原始变量为,新的变量(即主成分) 为,主成分和原始变量之间的关系表示为主成分分析的数学模型主成分分析的数学模型pxxx,21pxxx,21pyyy,21pyyy,21ppppppppppxaxaxayxaxaxayxaxaxay22112222121212121111主成分分析的数学模型主成分分析的数学模型主成分分析的数学模型主成分分析的数学模型aij为第为第i个主成分个

12、主成分yi和原 来的第和原 来的第j个变量个变量xj之间的 线性相关系数,称为载 荷之间的 线性相关系数,称为载 荷(loading)。比如,。比如,a11 表示第表示第1主成分和原来的 第主成分和原来的 第1个变量之间的相关系 数,个变量之间的相关系 数,a21表示第表示第2主成分 和原来的第主成分 和原来的第1个变量之间 的相关系数个变量之间 的相关系数11 - 17统计学统计学 STATISTICS (第三版第三版)2008年8月选择几个主成分?选择标准是什么? 被选的主成分所代表的主轴的长度之和占了主轴 总程度之和的大部分 在统计上,主成分所代表的原始变量的信息用其 方差来表示。因此,

13、所选择的第一个主成分是所 有主成分中的方差最大者,即Var(yi)最大 如果第一个主成分不足以代表原来的个变量,在 考虑选择第二个主成分,依次类推 这些主成分互不相关,且方差递减主成分的选择主成分的选择11 - 18统计学统计学 STATISTICS (第三版第三版)2008年8月究竟选择几个主成分才合适呢? 一般要求所选主成分的方差总和占全部方差的 80%以上就可以了。当然,这只是一个大体标准 ,具体选择几个要看实际情况 如果原来的变量之间的相关程度高,降维的效果 就会好一些,所选的主成分就会少一些,如果原 来的变量之间本身就不怎么相关,降维的效果自 然就不好 不相关的变量就只能自己代表自己

14、了主成分的选择主成分的选择11.1.3 主成分分析的步骤主成分分析的步骤11.1 主成分分析主成分分析11 - 20统计学统计学 STATISTICS (第三版第三版)2008年8月 对原来的p个指标进行标准化,以消除变量 在水平和量纲上的影响 根据标准化后的数据矩阵求出相关系数矩 阵 求出协方差矩阵的特征根和特征向量 确定主成分,并对各主成分所包含的信息 给予适当的解释主成分分析的步骤主成分分析的步骤11 - 21统计学统计学 STATISTICS (第三版第三版)2008年8月【例】【例】根据我国31个省市自治区2006年的6项主 要经济指标数据,进行主成分分析,找出主成 分并进行适当的解

15、释主成分分析主成分分析 (实例分析实例分析)31个地区的个地区的6项经济指标项经济指标11 - 22统计学统计学 STATISTICS (第三版第三版)2008年8月第第1步步 选择【Analyze】下拉菜单,并选择【Data Reduction- Factor】,进入主对话框 第第2步步 在主对话框中将所有原始变量选入【Variables】 第第3步步 点击【Descriptives】,在【correlation Matrix】下选择 【Coefficirnts】,点击【Continue】回到主对话框 第第4步步 点击【Extraction】,在【Display】下选择【Scree Plot

16、】,点击【Continue】回到主对话框 第第5步步 点击【Rotation】,在【Display】下选择【Loading Plot】,点击【Continue】回到主对话框 点击【OK】用用SPSS进行主成分分析进行主成分分析用用SPSS进行主成分分析进行主成分分析11 - 23统计学统计学 STATISTICS (第三版第三版)2008年8月SPSS的输出结果的输出结果各变量之间的相关系数矩阵各变量之间的相关系数矩阵变量之间的存在较强的相关关系,适合作主成分分析变量之间的存在较强的相关关系,适合作主成分分析11 - 24统计学统计学 STATISTICS (第三版第三版)2008年8月SPSS的输出结果的输出结果 (选择主成分选择主成分)各主成分所解释的原始变量的方差各主成分所解释的原始变量的方差该表是选则主成分的主要依据该表是选则主成分的主要依据11 - 25统计学统计

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号