主成分分析在能源消耗中的应用

上传人:suns****4568 文档编号:83085879 上传时间:2019-02-26 格式:DOC 页数:14 大小:311KB
返回 下载 相关 举报
主成分分析在能源消耗中的应用_第1页
第1页 / 共14页
主成分分析在能源消耗中的应用_第2页
第2页 / 共14页
主成分分析在能源消耗中的应用_第3页
第3页 / 共14页
主成分分析在能源消耗中的应用_第4页
第4页 / 共14页
主成分分析在能源消耗中的应用_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《主成分分析在能源消耗中的应用》由会员分享,可在线阅读,更多相关《主成分分析在能源消耗中的应用(14页珍藏版)》请在金锄头文库上搜索。

1、毕业论文题 目 主成分分析在能源消耗中的应用 学生姓名 学 号 学 院 专 业 统 计 指导教师 二 一 一 年 五 月 二 十 五 日目 录0 引言21建立模型21.1主成分分析的思想21.2主成分分析31.3回归分析与预测72 结论103建议10参考文献11致 谢12附录13 主成分分析在能源消耗中的应用 摘要:通过文献回顾提炼出对能源需求有重大影响的因素,基于中国1991年2009年的统计数据,利用主成分分析法消除了各影响因素间的多重共线性,结果表明经济发展水平和市场化水平显著影响能源需求。在此基础上建立了主成分回归模型对能源需求进行预测,并通过实际检验说明了该模型的预测效果较好。关键词

2、:能源需求;主成分分析;回归模型0 引言 中国地大物博、资源丰富,自然资源总量排世界第七位,能源资源总量约4万亿吨标准煤,居世界第三位。煤炭的资源量为为10024.9亿吨,石油的资源量为930亿吨,天然气的资源量为38万亿立方米,而石油和天然气储量只占资源量的约20%和约3%;水力的可开发装机容量为3.78亿千瓦,居世界首位;新能源与可再生能源资源丰富,风能资源量约为16亿千瓦,可开发利用的风能资源约2.53亿千瓦,地热资源的远景储量为1353.5亿吨标准煤,探明储量为31.6亿吨标准煤,太阳能、生物质能、海洋能等储量更是属于世界领先地位。但相对总人口规模巨大的中国来说,仍然是不多的。国内外许

3、多能源机构或相关机构对能源需求进行过研究, 得出了一些比较常用并且实用的分析方法,可以分为为时间序列预测法和回归预测法两大类1。时间序列预测法是一种考虑变量随时间变化规律并用该变量以往的统计资料建立数学模型做外推预测方法。由于时间序列预测法所需要的只是序列本身的历史数据,因此,这类方法应用非常广泛,具体方法有时间序列分解分析法,引动平均法,指数平滑法,趋势外推法,自适应过滤法,平稳时间学列预测法,灰色预测法,状状态空间模型和卡尔曼滤波。国内学者如杜雨潇 2运用回归移动平均模型对能源需求进行建模与分析,就是属于这种方法的范畴。回归预测法是用研究变量和变量之间相关关系的一种数理统计方法,应用回归分

4、析从一个或几个自变量的值去预测因变量的值。回归预测中的因变量和自变量在时间上时并进关系,即一边两的预测值要有并进的自变量来旁推。这类方法不仅考虑了时间因素,而且考虑了变量之间的因果关系。具体方法有一元线性回归预测法,多元线性回归预测法,非线性回归预测法等。本文就采用了回归预测法,建立了能源消耗量与影响因素之间的模型。 全球性的能源危机已经愈演愈烈,随着中国经济的快速发展,对能源的依赖越来越大,因而搞好能源需求预测为能源规划及政策的制定提供科学依据有着重要的理论及现实意义。林伯强3建立了包括中国能源消费量、国内生产总值、能源价格和结构变量的中国能源需求协整误差校正模型, 实证分析了上述变量间存在

5、长期均衡关系这样分析不是很精确。经过反复思考,本文认为能源消耗量影响国内生产总值,国内生产总值是因变量,而能源消耗量是自变量,所以将这个因素剔除。所以本文从上述变量中选取了能源价格和结构变量(包括煤炭消费比重、石油消费比重、天然气消费比重、水电核电风电消费比重)这些因素,并加入了工业占国民经济的比重、镇人口占总人口比重、能源的利用效率这些因素,利用主成分分析法分析这八个因素对能源消耗的影响,并作出定量分析。1建立模型1.1主成分分析的思想4主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,XP(比如p个指标),重新组合成一组较少个数的互不相关的

6、综合指标Fm来代替原来指标。那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。设F1表示原变量的第一个线性组合所形成的主成分指标,即,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差Var(F1)越大,表示F1包含的信息越多。常常希望第一主成分F1所含的信息量最大,因此在所有的线性组合中选取的F1应该是X1,X2,XP的所有线性组合中方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F1已有的信息就不需要再出现在F2中,即F2与

7、F1要保持独立、不相关,用数学语言表达就是其协方差Cov(F1, F2)=0,所以F2是与F1不相关的X1,X2,XP的所有线性组合中方差最大的,故称F2为第二主成分,依此类推构造出的F1、F2、Fm为原变量指标X1、X2XP第一、第二、第m个主成分。根据以上分析得知:(1) Fi与Fj互不相关,即Cov(Fi,Fj) = 0,并有Var(Fi)=aiai,其中为X的协方差阵(2)F1是X1,X2,Xp的一切线性组合(系数满足上述要求)中方差最大的,即Fm是与F1,F2,Fm1都不相关的X1,X2,XP的所有线性组合中方差最大者。F1,F2,Fm(mp)为构造的新变量指标,即原变量指标的第一、

8、第二、第m个主成分。 由以上分析可见,主成分分析法的主要任务有两点:(1)确定各主成分Fi(i=1,2,m)关于原变量Xj(j=1,2 , p)的表达式,即系数( i=1,2,m; j=1,2 ,p)。从数学上可以证明,原变量协方差矩阵的特征根是主成分的方差,所以前m个较大特征根就代表前m个较大的主成分方差值;原变量协方差矩阵前m个较大的特征值(这样选取才能保证主成分的方差依次最大)所对应的特征向量就是相应主成分Fi表达式的系数,为了加以限制,系数启用的是对应的单位化的特征向量,即有= 1。(2)计算主成分载荷,主成分载荷是反映主成分Fi与原变量Xj之间的相互关联程度: 1.2主成分分析本文数

9、据来源于2010年的中国统计年鉴5(1991-2009),燃料价格指数以1991年为基期。影响我国能源需求的因素较为复杂,以下几个方面的因素可以反映对能源需求的主要影响,理由如下: 工业占国民经济的比重 工业是消耗能源的主要行业,其能源消耗量通常占总消耗量的60%左右,本文采用工业占国民经济的比重作为反映产业结构的指标参与分析。(镇人口占总人口比重):城镇居民和农村居民的能源尤其是制造业, 其能源消耗量通常占总消耗量的60%左右。利用方式和消费水平有很大差别。城镇具有较完善的能源供应基础设施,本文将人口结构(以城镇人口占总人口比重表示)作为影响能源需求的一个重要因素进行分析。煤炭:中国是世界上

10、极少数几个以煤炭为主要能源的国家之一,用煤炭消费比重这一指标来反映能源消费结构对能源需求的影响。(石油):随着近几年石油价格的上涨和储备量的消耗,石油对能源的消耗量也起到了重要的指标作用(天然气):作为污染性较低的能源之一,天然气一直很受国家的重视。(水电、核电、风电):水电、可能。风电近几年得到了较好的发展,能有效反映能源需求量的变化(能源的利用效):能源的消费量与能源的利用效率密切相关。燃料价格指数:中国的能源价格形成机制是有管理的市场定价, 价格仍然起着调节市场供需的作用。本文采用燃料价格指数作为反映价格的指标, 用以检验中国能源市场的价格调节作用。由于选取的影响因素较多,各因素之间可能

11、存在一定程度的相关关系。本文采用相关矩阵法对各个影响因素是否存在多重共线性进行检验。相关系数矩阵法的检验结果如表1所示。表1:相关关系矩阵工业占国民经济的比重镇人口占总人口比重煤炭消费比重石 油天然气水电、核电、风电能源的利用效燃料价格指数工业占国民经济的比重1.000.464-.329.153.249.452.760.025镇人口占总人口比重.4641.000-.745.317.883.844.685-.426煤炭消费比重-.329-.7451.000-.838-.454-.829-.582.594石 油.153.317-.8381.000-.075.417.330-.475天然气.249.

12、883-.454-.0751.000.724.449-.276水电、核电、风电.452.844-.829.417.7241.000.673-.535能源的利用效.760.685-.582.330.449.6731.000-.291燃料价格指数.025-.426.594-.475-.276-.535-.2911.000由表1可以看出各个影响因素之间的相关系数较高,存在多重共线性。在多元线性回归中,当自变量存在严重的多重共线性时,用最小二乘法得到回归系数的估计值的方差将会很大,导致估计精度会降低,稳定性也可能变差,这样势必影响回归方程预测数据的可靠性。我们可以采用主成分分析方法来解决多重共线性的问

13、题。利用SPSS6软件对19年的原始数据进行主成分分析,输出结果如下表2、表3所示。由于2009年的能源利用效率是缺失的,本文用历年能源利用效率的平均值进行填补。表2:解释的总方差成份初始特征值提取平方和载入合计方差的(%)累积 (%)合计方差的(%)累积 (%)工业占国民经济的比重4.59757.46757.4674.59757.46757.467镇人口占总人口比重1.48118.51575.9821.48118.51575.982煤炭消费比重1.10513.81189.7931.10513.81189.793石 油.4765.95195.744天然气.1782.22897.972水电、核电、风电.1471.83699.808能源的利用效.015.192100.000燃料价格指数2.155E-162.693E-15100.000提取方法:主成分分析由表2可见,提取两个主成分时,第一主成分F1、第二主成分F2,第三主成分F3的贡献率分别是57.467%和18.515%以及13.811%,累计贡献率是89.793%,符合累计方差贡献率大于85%的原则。表3:主成分载荷矩阵成份F1F2F3工业占国民经济的比重.933.046-.141镇人口占总人口比重.917.227-.224煤炭消费比重-.898.380-.054石油消费比重.797.280.382天然气消费比

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号