文档详情

主成分指标构建

cl****1
实名认证
店铺
DOCX
18.56KB
约2页
文档ID:384045477
主成分指标构建_第1页
1/2

主成分指标构建基本思路:主成分指标构建的基本思想是设法将原来众多的具有一定相关性的指标(比 如 p 个指标),重新组合成一组新的互不相关的综合指标来代替原来指标通常 数学上的处理就是将原来p个指标作线性组合,作为新的综合指标但是这种线 性组合,如果不加限制,则可以有很多,在所有的线性组合中所选取的 F1 应该 是方差最大的,故称F1为第一主成分如果第一主成分不足以代表原来p个指 标的信息,再考虑选取F2即选第二个线性组合为了有效地反映原有信息,F1 已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(Fl, F2)=0 称F2为第二主成分,依此类推可以构造出第三、第四、…、第p个主成分主成分指标构建具体操作:1、 计算协方差矩阵计算样品数据的协方差矩阵:三=(sij)pxp,其中s = £ (x - x )(x - x )ij n — 1 k i kj j其中 i, j = 1,2,…,p k~l2、 求出工的特征值及相应的特征向量求出协方差矩阵三的特征值Xl>X2>-Xp>0及相应的正交化单位特征向量:r a )r a )r a )11121 paaaa=21, a =22, ..., a =2 p1...2...p....a丿p1,a丿 p2

3、 选择主成分在已确定的全部p个主成分中合理选择m个来实现最终的评价分析一般用 方差贡献率 £pa =X /乙入i i k解释主成分Fi所反映的信息量的大小,m的确定以累计贡献率G(m) = £九 /£九ik 达到足够大(一般在85%以上)为原则4、 计算主成分得分F = a X + a X +... + a Xi 1i 1 2 i 2 pi p计算n个样品在m个主成分上的得分:i = 1, 2,…,m5、 标准化 实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的 影响消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数 据变换:x — xx* = j i = 1,2,..., n; j = 1,2,..., pij s其中的j n iji=1标准化后变量的协方差矩阵(Covariance Matrix)工=(sij)pxp,即原变量的相关系数矩阵 (Correlation Matrix)R= (rij)pxp:i ys = x* x*ij n -1 ki kjk=1丄艺n-1k=1x - xkj jx - xk i'工(x - x )2 y (x - x )2' ti i | tj jt=1—n — 1t=^iy (x - x )(x - x )ki i kj j—■,y (x - x )2ti it=1= rEij (x - x )2 j' tj j■ t=1s 2 = 1 工(x - X )2 , j = 1, 2,…,p。

标准化后 j n - 1 ij ji=1数据阵记为X*,其中每个列向量(标准化变量)的均值为0,标准差为1,数据 无量纲i,j = 1, 2, ..., p此时n个样品在m个主成分上的得分应为:。

下载提示
相似文档
正为您匹配相似的精品文档