jz-基于主成分分析的评价方法的改进.ppt

上传人:cl****1 文档编号:569948663 上传时间:2024-07-31 格式:PPT 页数:27 大小:1.44MB
返回 下载 相关 举报
jz-基于主成分分析的评价方法的改进.ppt_第1页
第1页 / 共27页
jz-基于主成分分析的评价方法的改进.ppt_第2页
第2页 / 共27页
jz-基于主成分分析的评价方法的改进.ppt_第3页
第3页 / 共27页
jz-基于主成分分析的评价方法的改进.ppt_第4页
第4页 / 共27页
jz-基于主成分分析的评价方法的改进.ppt_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《jz-基于主成分分析的评价方法的改进.ppt》由会员分享,可在线阅读,更多相关《jz-基于主成分分析的评价方法的改进.ppt(27页珍藏版)》请在金锄头文库上搜索。

1、基于层次分析法的组合评价法 姓 名:陈从叶 指导教师:王俊杰 主成分分析法研究的背景及意义主成分分析法的基本原理主成分分析法的计算步骤主成分分析法的不足及改进主成分分析法改进的应用实例 内容纲要主成分分析法研究的背景及意义在实际问题中,为了全面系统地分析问题,必须考虑许多对实际过程有影响的因素,也称之为指标或变量。因为每个变量都在不同程度上反映了所研究问题的信息,而且指标之间或多或少都有一定的相关性,因此得到的统计数据所反映的信息在一定程度上会有所重叠;另一方面,在研究多变量问题时,变量太多会增大计算量,增加分析问题的复杂性,因此希望在定量分析的过程中涉及的变量少,而得到的信息量又多。主成分分

2、析法就是解决这一问题的理想工具。主成分分析法的基本原理主成分分析法主成分分析法是一种对数据降维的常用统计方法,它的基本思想是将原有的众多具有一定相关性的指标 重新整理出一组具有较少数目的互不相关的综合性指标来代替原始指标。 其中,综合指标的选取应该具备两个特点: 1.它能够最大程度反映原变量 所包含的信息; 2.它能够保持指标之间的相互无关; 设F1表示原变量第一个线性组合所形成的主成分指标, 即 其中每一个主成分所提取的信息量可用其方差来度量,其方差 越大,表示 所包含的信息越多。在实际应用中,人们希望第一主成分 所包含的信息量最大,因此在所有的线性组合中选取的 应该是 的所有线性组合中方差

3、最大的,故称 为第一主成分。如果第一主成分不足以代替原有n项指标的信息,再考虑第二个主成分指标 ,为有效的反映原信息, 中已有的信息就再出现在 中了,即 与 要保持独立、不相关,用数学语言表达就是其协方差 ,所以 是与 不相关的 的所有线性组合中方差最大的,故称 为第二主成分。 依此类推构造出的 为原变量指标 的第一、第二、第m项主成分。 主成分分析法的计算步骤主成分分析法主成分分析法的计算步骤如下: 1.设某综合评价是用p项指标,先将指标同趋势化,即将逆向指标转化为正向指标,一般用指标值的倒数代替原指标; 2.进行无量纲化。将p项指标的原始数据标准化; 3.计算指标的相关矩阵R,求R的p项特

4、征值记为 ,相应的正交化特征向量 ; 4.设方差贡献率 ,当累计方差贡献率G(q) 达到一定的数值(一般取大于等于 85%)时,取q项主成分 ,进而得到综合评价函数:5.将每一个样本的标准化指标值代入上式求得各样本的综合评价函数值,根据综合评价函数值对各样本进行排序。主成分分析法的不足及改进主成分分析法主成分分析法存在的不足主要表现在如下两点: 1.1.数据数据标准化标准化过程存在过程存在信息丢失信息丢失 在对指标进行标准化处理时存在信息丢失问题,使特征提取能力下降。传统主成分分析法采用变换方法为倒数法,这种方法改变了线性相关系数。从而特征值与特征向量也产生了变动。因此,对评价结果的准确性有影

5、响。 2.2.综合评价指标综合评价指标权重系数分配权重系数分配的不完全合理的不完全合理 在实际评价过程中我们常常发现,指标之间相关性高低程度影响着评价指标权重系数的分配,权重系数明显向相关性较高的变量倾斜,这些变量的权重系数明显高于其他变量的权重系数。不同研究者对问题偏重程度不同,使用的评价方法不同,就会造成不同的结果。所以在处理实际问题时,必须从多个角度综合考虑,才能做出正确的评价,因此需要均衡各个指标变量的系数。主成分分析法的改进1.1.原始数据的原始数据的均值化均值化 在传统主成分分析法中,为了消除变量量纲或数量级的影响,需要对原始数据进行标准化处理,但是在实施标准化的过程中,却抹杀了各

6、指标变异程度的差异信息。为了避免上述情况的发生,我们需要对原始数据进行均值化处理。 2.2.综合评价指标综合评价指标权重系数分配权重系数分配的改进的改进 设指标系统总体为I,按指标相关性强弱将总体I分成 和 两部分,将相关性较强的指标 分入 ,相关性较弱的指标 分入 , 。 对比传统主成分分析法的函数表达式 ,将相关性较强的指标连同它们的系数组合得函数 ,为指标相关性较弱的一组函数,且满足(1)指标个数相近时,各指标系数大体均衡;(2)指标个数相差悬殊时,满足多指标系数之和大于小指标系数之和,得改进后综合评价函数 ,则得到的综合评价函数比较合理。主成分分析法改进的应用实例应用一应用一:对我国各

7、地区独立核算工业企业经济效益评价 分别将传统主成分分析法、均值化改进模型应用于实例,数据结果如表1,表2所示。 1.运用传统主成分分析法求得的特征值、贡献率及累计贡献率如表1所示。表1 传统主成分分析得到的数据传统主成分分析法特征值贡献率累计贡献率13.79750.54250.542521.92030.27430.816831.07430.15350.970340.19020.02720.997550.01480.00210.999660.00240.00030.999970.00050.000112.运用均值化改进模型求得的特征值、贡献率及累计贡献率如表2所示。表2 均值化改进模型得到的数据

8、均值化改进模型特征值贡献率累计贡献率11.27640.68630.686320.44340.23840.924730.12860.06910.993940.00850.0460.0998550.00210.00110.999660.00050.00030.999970.00030.00011结果分析结果分析 从计算结果可以看出,均值化改进模型得到的第一主成分包含的信息比传统主成分分析法得到的第一主成分承载的信息高十四个百分点。因此均值化改进模型可以用较少的主成分提取更多的信息。 应用二应用二:施工企业的内部评优模型 根据项目总目标制定施工企业内部评优指标,具体评比数据如表3所示。表3 评比原始

9、数据序号单位进度X1质量X2安全文明X3内业资料X4产值加分X51一队25.2224.2225.119.13.722二队25.8925.6726.449.52.543三队26.6726.3326.568.85.194四队26.8926.1126.009.25.045五队27.0025.3326.448.33.056六队26.6726.2225.789.313.48模型求解模型求解 用Matlab对数据进行标准化处理求出标准化矩阵Z,并求出相关系数矩阵R。 标准化矩阵Z: 相关系数矩阵R: 从相关系数矩阵R可以看出质量指标X2与进度指标X1相关性比较大,安全文明施工指标X3与质量指标X2相关性大

10、,安全文明施工指标X3与进度指标X1相关性大。因此,X1,X2,X3相关性较大,S1=X1,X2,X3,X4,X5与前三者相关性较弱,两者之间的相关性也较弱,则S2=X4,X5。然后求出R的特征值、贡献率及累计贡献率如表4所示。表4 特征值、贡献率及累计贡献率特征值贡献率累计贡献率2.46880.493020.493021.56260.3120520.8050720.8050.1607590.9658310.13380.026720.9925510.03730.0074491.0000表5为主成分与指标之间的线性关系表5 主成分与指标之间的线性关系指标主成分工程进度0.5959-0.0286工

11、程质量0.55790.3230安全文明0.5115-0.2884内业资料-0.21170.5988产值加分0.16500.6731表6为评比原始数据按前两项主成分排序的结果。表6 评比原始数据按前两项主成分排序结果单位编号第一主成分第二主成分综合指标值排序综合指标值排序一队-3.01496-0.19344二队-0.432150.03793三队1.26901-0.32775四队0.580330.40182五队0.89892-1.74226六队0.559042.11411第一主成分分量的计算公式:第二主成分分量的计算公式:传统主成分分析的综合评价函数:改进后的综合评价函数:最后分别用传统与改进后的

12、主成分分析法算出结果,对比数据如表7所示。表7 传统与改进后的主成分分析法的结果比较单位编号传统主成分分析法改进主成分分析法综合评价值排序综合评价值排序一队-1.54686-3.04866二队-0.201150.14434三队0.523420.85063四队0.411530.9022五队-0.10054-0.73635六队0.935312.12971结果分析结果分析 在假设各指标在综合评价中的重要程度相同的情况下,对比综合评价函数表达式可知,传统主成分分析法分配给各指标系数明显偏向于相关性较强的集合 ,因此强化了 的信息,相应的削弱了 的信息,而用改进的主成分分析法使得相关性较强的集合 和相关

13、性较弱的集合 的指标系数相对接近,改进后更为合理。结 论 主成分分析法是由原始数据进入到数据处理和分析的关键步骤,是多元统计分析的重要组成部分。它通过对离散数据集合的分析来探求嵌入在高维数据空间中数据的不同样式,其目的是快速、有效地对高维数据进行数据降维或特征提取,用维数较低且互不相关的新变量来反映原变量所提供的绝大部分信息,以寻求事物的本质规律,为其后的聚类分析、回归分析、分类识别等分析处理阶段提供依据。 本文主要是对主成分分析法的改进方法进行研究。首先分析了主成分分析法在实际应用中存在的两点不足,然后针对两点不足应用相应的改进方法,并建立改进模型。最后将通过实例分析比较传统主成分分析法和改进的主成分分析法,依据结果说明改进后的主成分分析法较传统主成分分析法,在实际应用中有着更强的评价能力。 谢谢各位老师!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号