主成分分析和因子分析在评价区域经济发展水平中的应用.doc

上传人:汽*** 文档编号:559827198 上传时间:2023-09-13 格式:DOC 页数:7 大小:146.51KB
返回 下载 相关 举报
主成分分析和因子分析在评价区域经济发展水平中的应用.doc_第1页
第1页 / 共7页
主成分分析和因子分析在评价区域经济发展水平中的应用.doc_第2页
第2页 / 共7页
主成分分析和因子分析在评价区域经济发展水平中的应用.doc_第3页
第3页 / 共7页
主成分分析和因子分析在评价区域经济发展水平中的应用.doc_第4页
第4页 / 共7页
主成分分析和因子分析在评价区域经济发展水平中的应用.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《主成分分析和因子分析在评价区域经济发展水平中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析和因子分析在评价区域经济发展水平中的应用.doc(7页珍藏版)》请在金锄头文库上搜索。

1、!塑!至箜!塑!塑垡笪堡型兰主成分分析和因子分析曼鱼塞翌窒在评价区域经济发展水平中的应用贾万敬何建敏摘要:文章从主成分分析、因子分析的发展过程、基本原理应用等方面出发来全面地介绍多元数据处理的主要方法。文章以江苏省各地市经济发展水平为例,根据江苏省各市卑的国民经济主要统计指标,利用软件赴理的结果来说明上述方法在评价江苏省各地市的经济发展水平中的应用。关键词:主成分分析;因子分析;区域经济一、引言我国是一个经济与社会发展水平资源与环境禀赋情况在各区域间差异非常大的国家。自科学发展观提出以来,区域经济协调发展的研究得到了充分的重视。要制订出促进区域经济协调发展的有效政策,首先必需对区域经济发展的水

2、平做出合理的评价。从中找出形成区域经济发展水平差异的关键因素。主成分分析和因子分析是多元统计中十分常用的两种方法,本文将着重介绍这两种方法的基本原理、数学模型以便从根本上揭示出这两种方法的区别。本文还将介绍主成分分析和因子分析的发展历程和应用领域。结台江苏省区域经济发展的现状,选取反映年江苏省个地级市经济发展水平的个主要统计指标。运用因子分析方法对江苏省辑地级市的经济发展的基本状况进行综合评价。二、分析方法简介统计推断的理论工作大多数都是基于总体为多元正态的假定,然而在高于一维的情况下,要说明一组样本来自多元正态总体是非常困难的,而且多个变量使用的测量单位也可能各不相同或者变量闻的数值大小相差

3、很大。因此,要对多元数据进行处理,通常将初始变量标准化。主成分分析。()主成分综台评价的产生和发展。主成分分析( )的概念最早在年由皮尔逊( )首先引人对非随机变量讨论,年数学家霍特林()把它推广到随机向量。和 对主成分分析进行了较为系统地分析和阐述,而郭军教授系统地论述了综合评价的理论和方法,虽然目前还没有关于主成分综合评价方法的专著但很多专家学者对其进行了探讨和研究。一些学者不同的角度提出的稳健性问题,对此进行了研究,并且提出了各自的改进算法。有学者提出丁独立主成分分析()的概念,弓人非线性算法。也有学者从如何去除或减弱有限的样本集中少量“劣点”样本的影响从而获得准确主方向。常用的主成分分

4、析是从样本协方差矩阵来计算的而协方差矩阵对劣点值相当敏感,为了增强主成分分析的稳健性,对协方差进行算法改进,从而提高主成分分析的稳健性。主成分综合评价应用中也存在很大争议,有的学者就提出了究竟应选取多少个主成分来对样本进行排序的问题。一般来说,主要有两种观点:一是只用第一主成分,英国统计学家肯德尔认为:第一主成分能够最大限度地反映样本间的差异是概括指标差异信息的晟佳线性函数。因此只能用第一主成分对样本综合排序。我国也有部分学者持这种观点南开大学盂生旺老师从几何投影角度阐明在多指标综合评价中,只有第一主成分结合原始数据的信息最多,因而也就只能以第一主成分值作为综合评价值才合理。另一种观点则认为,

5、不仅要充分重视第一主成分而且也要顾及其它主成分在综台评价中所起的作用,否则损失的信息较多,有时甚至回歪曲样本间的实际相对地位。提出的改进办法是:先按累积方差贡献率不低于某个棚值(比如)的原则确定前几个主成分,然后以每个主成分各自的贡献率为权数将选定主成分线性加权求和来综合评价样本的优劣。()主成分分析的原理。主成分分析是一种通过降维技术把多个变量把多个变量化为少数几个主成分的统计分析分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线形组台。当原来个变量的总变差能够由少数几个线形组合来概括的话那么这些线形组合中包含的信息与原来个变量几乎一样多可以用这些线形组合替代

6、原来的个变量,这样会是观测数据从高维降到低维,简化了数据。主成分就是个变量。:,的一些特殊线形组合,这些线形组合把,:,。构成的坐标系旋转产生新的坐标系,在新坐标系中提供了协差阵的简洁表示。以(,)表示标准化的原变量,(,)表示主成分,(江,;,)表示组合系数,主成分分析的模型为:汁冰磷。一!垒窒翌窒!塑垡笪翌型堂!堡翌!塑u65291X()主成分分析的应用。主成分分析一般不是目的,而足研究的某个巾间环节通过这一处理来发现重要的变量和变量间的某种关系。在网于分析法中,通常用主成分分析法来确定公共网子。因子分析。()呙子分析方法的产生和发展。因子分析()方法最早是在年由斯皮尔曼()和皮尔逊( )

7、在一篇著名论文对智力测验得分进行统计分析中提出,之后被用于解决心理学和教育学方面的问题。由于这种方法计算量大,到了世纪年代得益于计算机的应用才有新的发展。型因子分析认为变量中存在一些不可观测的共同因素同时对原始变量产生影响需要通过一定的方法提取“重要”的公共因子;“重要性”取决于困子对变量的影响程度,用二者之间的相关系数(因子载荷)表示。根据变量与各因子的“紧密”程度,把原始变量归结到各因子中,通过这些“精炼”的因子认识复杂现象。因子分析的目的是用几个不可观测的隐变量来解释原始变量间的协方差关系。()因子分析的原理。因子分析是假定个变量的变异主要是一些共同的因子引起的希望用少数几个公共因子来解

8、释变量中的主要变化。由于样本内含样品和指标的两维性,因子分析分为型和型,前者足基于指标的分析,而后者是基于样品的分析。因子分析的数学模型(正交因子模型)为:是,口u8216X岛当,。表示个指标时该模型为型模型,当,:,。表示个样品时该模型为型模型。式中:(,。)是可测个指标构成的维随机向量;(,)是不可观测的向量,称为的公共因子;,称为因于载荷,它是第个变量在第个公共因子上的负荷矩阵称为因子载荷矩阵;称为的特殊因子中包括随机误差。因于分析可以分解为确定因子载荷、园子旋转及纠算因子得分三个步骤。系数阵帅是初始因子载荷阵,因子载荷,的统计意义就足第个变量与第个公共因子之间的相关系数。估计一有多种方

9、法,如主成分分析法、主轴因子法、晟小二乘法、极大似然法、因子提取法等。其主成分法应用最为广泛,因子分析与主成分分析并没有原理上的实质联系主要是外观的联系。因为用主成分法得到初始载荷阵。(、。,、凡,一,、。),是的特征根凡。对应的单位特征向量,它也是主成分分析系数阵啪。第个系数向量,所以曲第列系数向量与一第行系数向量仅相差倍数。用主成分法确定因子载荷的方法比较简单,但是这种方法所得到的特殊因子。,岛,毛之间并不相互独立,因此用主成分法确定因子载荷不完全符合因子模型的假设前提,也就是说所得的因子载荷并不完全正确。但是当共同度较大时,特殊因子所引起的作用较小,因而特殊因子之间的相关性所带来的影响就

10、几乎可以忽略。由于满足上述模型的系数阵帅不唯一,这成为因子载荷阵旋转的理论依据。一般情况下,初始因子载荷阵中各变量对因子的系数没有靠近两极数值和,说明各变量在每个因子上“分量”差不多。备因子并不“偏向”某些变量这样很难提炼公共困子的意义,因此要旋转咖。改变它的坐标系,使变量“偏向”不同的因子,并根据系数绝对值对变量归类袁年江苏省各市国民经济主要统计指标人均高新技术第二产第产第三产城镇固定地方财政规模以规模以上社会消费消费品增长率产业产业产值业产值 业产值资产投资总收入上工业工业利税品零售总零售总(元人)()值(亿元)(亿元)(亿元) 增长率(亿元)(亿元)增加值总额额(亿元)额增长()(亿元)(亿元)率(),】南京 无锡 徐州 常州 苏州 南通 “连云港 淮安 。盐城 扬州 镇江 泰州 宿迁, 一!:至笙!塑!型垡篁堡登堂!墨量塑堑命名,最常爿的旋转方法是最大方差正交旋转。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号