数据均值化处理的优势

资源描述

《数据均值化处理的优势》由会员分享，可在线阅读，更多相关《数据均值化处理的优势（3页珍藏版）》请在金锄头文库上搜索。

1、纪荣芳：主成分分析法中数据处理方法的改进，山东科技大学学报(自然科学版)2007 年 12 月，第 26 卷第 05 期对数据进行均值化处理方式的考察一、对数据进行无量纲处理的方法（一）极差化处理公式：新数据=（原数据-极小值）/（极大值-极小值）（二）中心化处理公式：新数据=（原数据-均值）/标准差（标准化后，新数据指标：均值为 0，方差为 1）（三）Decimal scaling 小数定标标准化公式：新数据= 元数据/(10*a)（四）极大化处理公式：新数据= 原数据/极小值（五）极小化处理公式：新数据= 原数据/极大值（其中，a 是满足条件的最小整数）（六）均值化处理公式：新数据=

2、原数据/均值（标准化后，新数据指标：均值为 1）二、变异系数= （标准差/均值） 100%三、中心化处理和均值化处理的比较（一）中心化处理这种标准化的结果将导致数据的一部分信息丢失，即丢失各指标间变异系数上的区别。（二）均值化处理1.均值化后保留各指标的变异系数（1 ）均值化前各指标的变异系数= 均值化后各指标的变异系数，即均值化后变异系数不变（2 ）均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方证明（1）：表示均值化前的原数据，表示原数据的均值= 表示均值化后的新数据，为均值化后各指标的变异系数, 为均值化前各指标的变1()2 1()2异系数1()2 =1

3、(1)21 = 1( )2=1()2纪荣芳：主成分分析法中数据处理方法的改进，山东科技大学学报(自然科学版)2007 年 12 月，第 26 卷第 05 期经验数据：spss 数据包 student.sav 的体重变量。均值化前，其变异系数0.217693。均值化后，其变异系数仍然为 0.217693。此处变异系数主要由EXCEL 操作而得。证明（2）：设有 n 个被评价对象，每个被评价对象用 p 个评价指标来描述, 原始数据为 n p , 均() 值化后得数据 = 1，协方差矩阵，其中 )， ()= 11()(因为均值化后各指标均值为 1，所以)= 11()(= 11(1)(1)=

4、 11(1)(1)= 11( )( )= 11()()= 11()()=11()()为原数据的协方差，当 i=j 时11()() = 11()22 =(11()22 )2=()2即均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方2.均值化后保留各指标间的相关系数（1 ）均值化前各指标相依系数= 均值化后各指标相依系数，即均值化后相依系数不变。证明（1）：均值化前的相依系数=(）（）(） 2(） 2= 均值化后的相关系数= = =（三）总结对原始数据进行均值化处理后，不仅消除了指标量纲和数量的影响，而且能更加全面地反映原始数据中各指标的变异程度和相互影响程度的信息。与中心化处理相比，均值化处理得到的结果更准确。

展开阅读全文

数据均值化处理的优势

最新文档