应用多元统计分析课程论文

上传人:ni****g 文档编号:557959804 上传时间:2023-01-13 格式:DOCX 页数:12 大小:66.63KB
返回 下载 相关 举报
应用多元统计分析课程论文_第1页
第1页 / 共12页
应用多元统计分析课程论文_第2页
第2页 / 共12页
应用多元统计分析课程论文_第3页
第3页 / 共12页
应用多元统计分析课程论文_第4页
第4页 / 共12页
应用多元统计分析课程论文_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《应用多元统计分析课程论文》由会员分享,可在线阅读,更多相关《应用多元统计分析课程论文(12页珍藏版)》请在金锄头文库上搜索。

1、应用多元统计分析课程论文学院 :专业 :班级 :学号 :论文题目:江苏省各地区物流产业发展的综合评价 信息与网络工程学院信息与计算科学2013 级 1 班2015 年 11 月 30 日安徽科技学院教务处摘要现代意义上的物流管理出现在20 世纪80年代,人们发现利用跨职能的流程 管理的方式去观察,分析和解决企业经营中的问题非常有效,通过分析物料从原 材料运到工厂,流经生产线上每个工作站,企业可以消除很多看似高效率却实际 上降低了效率的局部优化行为。物流产业的实质体现为技术密集和劳动密集相结 合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。物流产业 对经济增长,特别是区域经济增长和

2、区域产业协作的推动,都有着不可替代的重大 意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障 作用。本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多 元统计分析中的主成分分析方法,因子分析作为比较,判断本问题哪种方法更为 适合,对江苏省沿江地区 20个地市的物流发展现状进行了综合评价,为江苏省 各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿 江地区整体物流发展水平。【关键词】主成分分析;因子分析;物流产业;综合评价一、引言随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深 化,经济的快速增长对物流业产生了巨大的需求,

3、促使物流业以及与物流相关的 交通运输、仓储配送和邮电通信业等都有较快的发展。同时,作为经济增长的“加 速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本, 促进了经济的可持续发展。物流对于经济增长的影响以及物流业与经济增长之间 的关系已经成为物流领域的一个研究重点。本文拟从主成分分析的角度出发,以 江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展 现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。二、模型的建立2.1 主成分分析主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种 统计分析方法,由于多个变量之间往往存在着

4、一定程度的相关性,因此从数学角 度来看,这是一种降维处理技术。以各个主成分为分量就得到一个更低维的随机 向量。因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个nXp阶的数据矩阵cxx11xx12.x、xp x 二21222p xxx nln2np(1)可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克 服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的 变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标

5、所反映的 信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何 选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合 系数,使新的变量指标之间相互独立且代表性最好新变量指如果记原来的变量指标为X,X,x,它们的综合指标1 2 p标为 Z, Z,Z ( m W p )。贝UXppX2 p p(2)11mz =1 x +1 x +.+11 11 1 12 2z = 1 x +1 x +.+12 21 1 22 2Xmp pz = 1 x +1 x +.+1mm11m 22在(2)式中,系数1 由下列原贝来决定ij(1) Z 与 z (i H j ; i, j =

6、1,2,m 相互无关);ij(2) 量。Z是x,x,x的一切线性组合中方差最大者;Z是与Z1 1 2 p 2 1不相关的x,x,x的所有线性组合中方差最大者;Z是与Z,12pm1Z,Z 都不相关的x,x,x的所有线性组合中方差最大者。2m-l12P这样决定的新变量指标Z,Z,Z分别称为原变量指标x,x,,12m12x的第一,第二,第m主成分。其中,Z在总方差中占的比例最大,Z,p 1 2z , z 的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成 3m分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量x( j =1, 2,

7、,p ) 在诸主成分Z ( i =1,2,m)上的载荷l ( i =1,2,m ; j =1,2, p ),从数学上容易知道,它们分别是X,x的相关矩阵的m个较大12p的特征值所对应的特征向量。主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是 利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合 成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。 并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓 住主要矛盾进行分析。基本步骤为:确定分析变量,收集数据;原始数据的标准化处理;由标准数 据求协方差矩阵;求R的特征值、特征

8、向量和主成分的方差贡献率;提取主成分; 求主成分分值,计算综合分值。2.1.1数据选取以及指标来源根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获 得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以 及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产 值”作为产业结构的影响因素。具体选择的指标为:x :地区生产总值,单位:亿元;1x :第一产业产值,单位:亿元;2x :第二产业产值单位:亿元;3x :第三产业产值单位:亿元;4x :公路里程,单位:公里;5x :以及车辆拥有量,单位:万辆;6其中,三大产业不仅考虑了区域经济总量,还考

9、虑了江苏省经济结构对物流 需求规模影响。(具体的原始数据见表 1 所示)江苏省区江阴市常州市区常熟市张家港市太仓市南通市区启东市如皋市海门市扬州市区仪征市江都市镇江市区丹阳市扬中市句容市泰州市区靖江市泰兴市表1 2013年江苏省各地区6项主要指标3825.761713.191919.421230.701402.00612.011144.90359.50355.15415.00830.87227.29402.08741.26502.21213.48215.12458.53364.43337.0798.7232.2144.1126.9319.9824.6641.3249.2936.9733.431

10、9.7713.0532.6316.5129.387.5621.6011.7915.4127.011694.961028.401098.67691.77870.32355.35652.70188.48198.28247.97483.79137.27228.04442.62285.37125.84119.25291.89214.69193.232032.08652.58776.64512.00511.70232.00450.88121.73119.90133.60327.3176.97141.41282.13187.4680.0874.27154.85134.33116.8375812347385

11、9304214521168305126392997225618981457211614761991958230710451182196763.8514.4729.5613.5111.526.4115.914.304.314.039.591.903.647.734.551.821.564.773.383.26数据来源:江苏省统计年鉴 20132.1.2先用因子分析对数据处理我们要考虑的是:如何根据这些经济指标,对各个地区进行综合评价与排序?因子分析也是一种降维,简化数据的技术。它通过研究众多变量之间的内部 依赖关系,探求观察数据中的基本结构,在研究江苏省沿江地区物流发展示所涉 及的指标很多,过多

12、的指标容易导致分析过程复杂化。一个合适的做法就是从这 些关系错综复杂的经济指标中提取少数几个主要因子,每个主要因子都能反映相 互依赖的社会经济指标见共同作用,因此选取 “公路里程以及民用汽车拥有量 ” 作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的 影响因素,抓住这些主要因素就可以帮我们对复杂的物流发展问题进行深入分 析,合理解释和正确评价。213因子载荷a的统计ij对于因子模型:i11+a fi 2 2+.+a fij j+.+a fim m我们可以得到x与f的协方差为iicov( x , f ) = covii= cov+ cov)=aikk=1ij设因子载荷矩阵

13、为A,称第j列元素的平方和,即j = 1,2,.mi=1 ij为公因子f 对x的贡献,即g 2表示同一公共因子f 对各变量所提供的方jjj差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。三、模型求解3.1 以因子分析的结果进行主成分分析(一)主要运算结果分析变量共同反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子 载荷阵中每行的因子载荷的平方和,提取的因子个数不同,变量共同程度也不同。 从标准化数据出发,我们先计算这些指标的主成分,然后通过主成分的大小进行 排序,对原始数据进行标准化处理。计算特征值、方差贡献率以及各指标的相关 系数矩阵。利用SAS9.1.3软件对标准处理的数据进行处理。特征值、方差贡献率 的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合 得分如表4 所示,表 2 方差分析表主成分初始特征值提取的主成分载荷的平方和特征值万差贝献率累计方差贡献率特征值方差贡献率累计方差贡献率5.429890.5090.505.429890.5090.500.46587.7698.260.46587.7698.260.05870.9899.24

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号