环境因子分析

上传人:F****n 文档编号:97047771 上传时间:2019-09-01 格式:PPT 页数:73 大小:6.64MB
返回 下载 相关 举报
环境因子分析_第1页
第1页 / 共73页
环境因子分析_第2页
第2页 / 共73页
环境因子分析_第3页
第3页 / 共73页
环境因子分析_第4页
第4页 / 共73页
环境因子分析_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《环境因子分析》由会员分享,可在线阅读,更多相关《环境因子分析(73页珍藏版)》请在金锄头文库上搜索。

1、环 境 统 计 学,授课教师:林红军 授课时间:2010学年第二学期,Presentation,(Environmental Statistics ),环境科学系 办公地点:校8幢123室,17幢616室 E-mail: , Cell:159 5845 9856, 679856,环 境 统 计 学,第1章 绪论 第2章 概率统计基础 第3章 环境一元线性回归分析 第4章 环境多元线性回归分析 第5章 环境系统聚类分析 第6章 环境判别分析 第7章 环境主成分分析 第8章 人工神经网络,环境因子分析,环境因子分析,因子分析概述,因子分析模型及求解,因子旋转与得分,环境应用及SPSS求解,一般认

2、为因子分析是从Charles Spearman在1904年发表的文章对智力测验得分进行统计分析开始,他提出这种方法用来解决智力测验得分的统计方法。目前因子分析在心理学、社会学、经济学等学科中都取得了成功的应用,是多元统计分析中典型方法之一。 因子分析(factor analysis)也是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。,1 概 述,1 概 述,考试的例子,物理,数学

3、,化学,语文,地理,历史,1 概 述,商店形象,员工人数 商品种类 资产规模 广告投入 年营业额 净利润 . . . . . .,商店的环境 商店的服务 商品的价格,因子分析就是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。,通过因子分析,这15个方面可以归结为应聘者的外露能力、讨人喜欢的程度、经验、专业能力和外貌这五个因子。,公司老板对48名应聘者进行面试,并给出他们在15个方面所得的分数,这15个方面是:,1 概 述,1 概 述,中国大学100强排名出炉,1 概 述,1 概 述-基本思想,于是,原始观测的随机变量X可分解为不可观测(或未做观测)的两个随机向量的线性组

4、合: 一是对整个X有影响的公共因素公因子; 二是只对各个对应分量有影响的特殊因素特殊因子,对于直接可观测的随机变量,根据其相关性大小,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,用一个不可观测的综合变量表示,这个基本结构称为公因子,1 概 述-基本任务,建立因子载荷矩阵 给出各公共因子的合理解释及命名 若有必要(当难以招到合理解释的公共因子)时,进一步作因子旋转,因子分析的基本任务,1 概 述-分类,因子分析,R型因子分析,Q型因子分析,R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析,主成分分析: 原始变量的线性组合表示新的综合变量,即主

5、成分;,n个指标或变量,n个综合指标或变量,y1,y2,y3,yn,计算y1yn的贡献大小,进行取舍,与主成分分析比较,主成分分析的一般目的:,变量的降维,主成分的解释,17个变量,国民经济指标,3个变量,主成分分析,主成分分析例子,样本,x1,x2,因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。,n个指标或变量,因子分析的目的是,用几个不可观测的隐变量来解释原始变量间的协方差关系。,因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;,回归分析:一个结果(变量)与多个变量的关系,因子分析:一个变量与多个假定的因子(变量)的关系,与回归

6、分析比较,与回归分析比较,回归 分析,因子 分析,由因索果,执果析因,因 果,这十项全能项目为:100米跑 ,跳 远 ,铅球 ,跳高 ,400米 跑 ,110米跨栏 ,铁饼 ,撑杆 跳远 ,标枪 ,1500米 。对 经标准化后所作的因子分析表明,十项得分基本上可归结于他们的 短跑速度,爆发性臂力、爆发性腿力和耐力,每一方面都称为一个因子。,例1 林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。,十项全能例,因子模型,因子得分计算公式,十项得分与这四个因子之间的关系可以 描述为如下的因子模型:,其中 表示四个因子,称为

7、公共 因子(common factor), 称为 在因子 上的因子载荷(loading), 是 的均值, 是 不能被四个因子解释的部分,称之为特殊因子。,公共因子,因子载荷,特殊因子,均值,原始观测的随机变量可分解成,不可观测的两个随机向量的线性组合,2 因子分析模型及求解,城市环境质量评价指标有:COD、BOD5、NH3、TSP、SO2和NOX,现有100个样本,用 来表示。,COD、BOD5、NH3、TSP、SO2、NOX,COD、BOD5、NH3、TSP、SO2、NOX,水环境因素,大气环境因素,COD指标,第 指标,第 指标,通常先对X作标准化处理,使标准化得到的新变量均值为0,方差为

8、这样就有 则称X为具有k个公共因子的因子模型,2 因子分析模型及求解,如果满足 ()fi的均数为,方差为; () i的均数为,方差为i; () fi与 i相互独立 (4) fi与fj相互独立(ij) 则称该因子模型为正交因子模型。,E(F)=0, Cov (F)=Ik,Cov (F,U)=0,正交因子模型的统计意义: X的方差可表示为 设,()hi2是k个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(common variance) ()i称为特殊方差(specific variance),是不能由公共因子解释的部分,估计因子载荷,求原始变量相关

9、矩阵; 求相关矩阵的特征根(因子的贡献),并排序 计算所有特征根对应的所有线形无关的特征向量; 特征向量转置,乘以特征根的平方根,即得到因子载荷。,因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。 设 称gj2为公共因子fj对X的“贡献”,是衡量公共因子fj重要性的一个指标。,共同度,贡献度,确定因子个数,一般原则: 累积贡献率(累积方差)达到7085; 特征根1。,解释潜在因子的实际意义,解释潜在因子的实际意义,一般以因子载荷的大小为依据。因子载荷大的指标变量受潜在因子支配的作用大。 如何判别因子载荷的大小? 当因子载荷大于或等于0.5时,可认为该因子f支配对应的指标X。,x1

10、方差中的80.5%被潜在因子f所解释; x2方差中的92%被潜在因子f所解释; x3方差中的64.5%被潜在因子f所解释。,2 因子分析模型的求解,设随机向量 的均值为,协方差为, 为的特征根, 为对应的 标准化特征向量,则,主成分分析法,上式给出的表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有,38,上式有一个假定,模型中的特殊因子是不重要的,因而从的分解中忽略了特殊因子的方差。,39,因子分析五步走,3 因子旋转及得分,因子旋转的目的,建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个因子的意义,以便对实际问题

11、进行分析,如果求出的主因子解后,各个主因子的典型变量不很突出,还需要进行因子旋转。,因子旋转的目的是使因子载荷两极分化,因子载荷的平方根要么接近于0,要么接近于1。,通过适当的旋转得到比较满意的因子。,3 因子旋转及得分,因子旋转方法,正交旋转,斜交旋转,正交旋转法基本思想,以使各因子载荷值的方差达到最大作为因子载荷矩阵简化的准则,且保持原公因子的正交性和变量共同度hi2不变,此时公因子的方差贡献则不再与原来相同。 可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释,3 因子旋转及得分,(1),3 因子旋转及得分,(2),3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得

12、分,3 因子旋转及得分,当m2时,我们可以逐次对每两个公共因子和进行上述旋转。对公因子Fl和Fk进行旋转,就是对A的第l和k两列进行正交变换,使这两列元素平方的相对方差之和达到最大,而其余各列不变,其正交变换矩阵为,3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得分,正交旋转及正交点投影,3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得分,3 因子旋转及得分,因子分析的步骤,输入原始数据xn*p,计算样本均值和方差,进行标准化计算(处理); 求样本相关系数矩阵R=(rij)p*p; 求相关系数矩阵的特征根i (1,2,p0)和相应的标准正

13、交的特征向量li; 确定公共因子数; 计算公共因子的共性方差hi2; 对载荷矩阵进行旋转,以求能更好地解释公共因子; 对公共因子作出专业性的解释。,4 环境应用及SPSS求解,例1. 某地区对城市大气颗粒物进行监测。得到16个样本,样本颗粒中各类物质的含量见下表.请对该监测数据进行因子分析并给出结论。,样本中大气颗粒物成分分析结果表,解:,1.数据标准化-标准差标准化,X =,2.求X的协方差矩阵 R,1.0000 -0.1599 1.0000 0.5886 -0.2580 1.0000 0.3407 -0.1442 0.8707 1.0000 0.6494 -0.0489 0.8991 0.

14、8309 1.0000 0.3480 -0.0966 0.8801 0.9475 0.8790 1.0000 0.8095 -0.2573 0.3917 0.1454 0.4282 0.2655 1.0000 0.7441 -0.1222 0.7539 0.6390 0.9132 0.6529 0.4754 1.0000 0.6552 0.0158 0.7732 0.6980 0.9236 0.7565 0.3796 0.8662 1.0000 0.5776 -0.1195 0.3251 0.1242 0.4622 0.3488 0.7917 0.4042 0.4957 1.0000 0.63

15、33 -0.1312 0.6697 0.4310 0.5855 0.4792 0.5640 0.5542 0.5172 0.4460 1.0000,R =,3.求R的特征值和特征向量 V,Lambda=eig(R),-0.3436 0.0055 -0.3883 0.0722 0.4218 -0.3602 0.2926 -0.3343 0.0860 0.3488 0.3030 0.0599 -0.1013 -0.0050 -0.0941 -0.0409 -0.2238 -0.2219 -0.0716 0.9178 -0.1534 -0.0719 0.2011 -0.2903 0.1040 -0.7476

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号