数据均值化处理的优势

上传人:平*** 文档编号:13294583 上传时间:2017-10-23 格式:DOC 页数:3 大小:412.41KB
返回 下载 相关 举报
数据均值化处理的优势_第1页
第1页 / 共3页
数据均值化处理的优势_第2页
第2页 / 共3页
数据均值化处理的优势_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据均值化处理的优势》由会员分享,可在线阅读,更多相关《数据均值化处理的优势(3页珍藏版)》请在金锄头文库上搜索。

1、纪荣芳:主成分分析法中数据处理方法的改进 , 山东科技大学学报(自然科学版)2007 年 12 月,第 26 卷第 05 期 对数据进行均值化处理方式的考察一、对数据进行无量纲处理的方法(一)极差化处理公式:新数据=(原数据-极小值)/(极大值-极小值)(二)中心化处理公式:新数据=(原数据-均值)/标准差(标准化后,新数据指标:均值为 0,方差为 1)(三)Decimal scaling 小数定标标准化公式:新数据= 元数据/(10*a)(四)极大化处理公式:新数据= 原数据/极小值(五)极小化处理公式:新数据= 原数据/极大值(其中,a 是满足条件的最小整数)(六)均值化处理公式:新数据=

2、 原数据/均值(标准化后,新数据指标:均值为 1)二、变异系数= ( 标准差/均值) 100%三、中心化处理和均值化处理的比较(一)中心化处理这种标准化的结果将导致数据的一部分信息丢失,即丢失各指标间变异系数上的区别。(二)均值化处理1.均值化后保留各指标的变异系数(1 )均值化前各指标的变异系数= 均值化后各指标的变异系数,即均值化后变异系数不变(2 )均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方 证明(1):表示均值化前的原数据, 表示原数据的均值= 表示均值化后的新数据 , 为均值化后各指标的变异系数, 为均值化前各指标的变1()2 1()2异系数1()2 =1

3、(1)21 = 1( )2=1()2纪荣芳:主成分分析法中数据处理方法的改进 , 山东科技大学学报(自然科学版)2007 年 12 月,第 26 卷第 05 期 经验数据:spss 数据包 student.sav 的体重变量。均值化前,其变异系数0.217693。均值化后,其变异系数仍然为 0.217693。此处变异系数主要由EXCEL 操作而得。证明(2): 设有 n 个被评价对象,每个被评价对象用 p 个评价指标来描述, 原始数据为 n p , 均() 值化后得数据 = 1,协方差矩阵 ,其中 ), ()= 11()(因为均值化后各指标均值为 1,所以)= 11()(= 11(1)(1)=

4、 11(1)(1)= 11( )( )= 11()()= 11()()=11()()为原数据的协方差 ,当 i=j 时11()() = 11()22 =(11()22 )2=()2即均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方2.均值化后保留各指标间的相关系数(1 ) 均值化前各指标相依系数= 均值化后各指标相依系数,即均值化后相依系数不变。 证明(1):均值化前的相依系数=()( )() 2() 2= 均值化后的相关系数= = =(三)总结对原始数据进行均值化处理后,不仅消除了指标量纲和数量的影响,而且能更加全面地反映原始数据中各指标的变异程度和相互影响程度的信息。与中心化处理相比,均值化处理得到的结果更准确。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号