数学建模多元统计分析

上传人:新** 文档编号:503899890 上传时间:2023-07-03 格式:DOC 页数:19 大小:672.50KB
返回 下载 相关 举报
数学建模多元统计分析_第1页
第1页 / 共19页
数学建模多元统计分析_第2页
第2页 / 共19页
数学建模多元统计分析_第3页
第3页 / 共19页
数学建模多元统计分析_第4页
第4页 / 共19页
数学建模多元统计分析_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《数学建模多元统计分析》由会员分享,可在线阅读,更多相关《数学建模多元统计分析(19页珍藏版)》请在金锄头文库上搜索。

1、精选文库精选文库实验报告一、实验名称多元统计分析作业题。二、实验目的(一)了解并掌握主成分分析与因子分析的基本原理和简单解法。(二)学会使用matlab 编写程序进行因子分析,求得特征值、特征向量、载荷矩阵等值。(三)学会使用排序、元胞数组、图像表示最后的结果,使结果更加直观。三、 实验内容与要求精选文库四、实验原理与步骤(一)第一题:1、实验原理:因子分析简介:(1) 1.1 基本因子分析模型设 p 维总体 x=(x1,x2,.,xp) 的均值为 u=(u1,u2,.,u3) ,因子分析的一般模型为x1=u1+a11f1+a12f2+.+a1mfm+1x2=u2+a21f1+a22f2+.+

2、a2mfm+ 2.xp=up+ap1f1+fp2f2+.+apmfm+ p其中, f1,f2,.,fm 为 m 个公共因子;i 是变量 xi(i=1,2,.,p) 所独有的特殊因子,他们都是不可观测的隐变量。称aij(i=1,2,.,p;j=1,2,.,m) 为变量 xi 的公共因子fi 上的载荷,它反映了公共因子对变量的重要程度,对解释公共因子具有重要的作用。上式可以写为矩阵形式x=u+Af+ 精选文库其中A=(aij)pxm称为因子载荷矩阵;f=(f1,f2,.,fm) 为公共因子向量;=( 1, 2,. p)称为特殊因子向量(2) 1.2 共性方差与特殊方差xi 的方差 var(xi)

3、由两部分组成,一个是公共因子对xi 方差的贡献,称为共性方差;一个是特殊因子对xi 方差的贡献,称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。(3) 1.3 因子旋转因子分析的主要目的是对公共因子给出符合实际意义的合理解释,解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时,并且绝对值大的元素较少时,则该公共因子就易于解释,反之,公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转(例如正交旋转),使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化,这样就使得因子的解释变得容易。因子旋转方法有正交旋转和斜交旋转两种,这里

4、只介绍一种普遍使用的正交旋转法:最大方差旋转。 这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值(或平方值) 尽可能地向两极分化,即少数元素的绝对值(或平方值)取尽可能大的值,而其他元素尽量接近于 0.(4) 1.4 因子得分在对公共因子做出合理解释后,有时还需要求出各观测所对应的各个公共因子的得分,就比如我们知道某个女孩是一个美女,可能很多人更关心该给她的脸蛋、身材等各打多少分,常用的求因子得分的方法有加权最小二乘法和回归法。注意:因子载荷矩阵和得分矩阵的区别:因子载荷矩阵是各个原始变量的因子表达式的系数, 表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因

5、子之间的关系,在某一公因子上得分高,表明该指标与该公因子之间关系越密切。简单说,通过因子载荷矩阵可以得到原始指标变量的线性组合,如 X1=a11*F1+a12*F2+a13*F3, 其中 X1 为指标变量 1, a11、 a12、a13 分别为与变量 X1 在同一行的因子载荷, F1、 F2、 F3 分别为提取的公因子;通过因子得分矩阵可以得到公因子的线性组合,如F1=a11*X1+a21*X2+a31*X3,字母代表的意义同上。(5) 1.5 因子分析中的 Heywood (海伍德)现象如果 x 的各个分量都已经标准化了,则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差

6、均大于0,并且小于1。但在实际进行参数估计的时候,共性方差精选文库的估计可能会等于或超过1,如果等于1,就称之为海伍德现象,如果超过1,称之为超海伍德线性。 超海伍德现象意味着某些特殊因子的方差为负,表明肯定存在问题。造成这种现象的可能原因包括:共性方差本身估计的问题;太多的共性因子,出现了过拟合;太少的共性因子,造成拟合不足;数据太少,不能提供稳定的估计;因子模型不适合这些数据。当出现海伍德现象或超海伍德现象时,应对估计结果保持谨慎态度。可以尝试增加数据量,或改变公共因子数目, 让公共因子数目在一个允许的范围内变动, 观察估计结果是否有改观;还可以尝试用其他多元统计方法进行分析,比如主成分析

7、。2、实验步骤:(1) 将原始数据标准化处理 ;(2) 建立相关系数矩阵并计算其特征值和特征向量;将题目所给的相关系数矩阵输入并设为PHO ,利用x,y=eig(PHO) 求得 PHO 的特征值和特征向量。(3) 选择特征值大于等于1 的特征值个数为公共因子数,或者根据特征值累计贡献率大于80%来确定公共因子。从 y 表(特征值表) 中我们可以看出大于等于1 的特征值个数为4,所以公共因子数也为4。(4) 求得正交或斜交因子载荷矩阵;通过上一步,我们得到了因子载荷矩阵lambda。因子分析,公共因子数为4,设置特殊方差的下限为0,使用factoran 函数进行因子旋转。设置表头与变量名,计算贡

8、献率与累计贡献率。将lambda、 Contribut 、 CumCont放在一起,转为元胞数组,并显示最后的结果。(5) 计算公因子得分和综合得分。计算因子得分方法是:用每个共因子的方差贡献率做权数,对每个因子进行加权,然后加总得到每个项目的总因子得分按总得分的多少进行排序,以反映不同免死方面对结果的影响。精选文库根据第3 步我们可以得到因子14 的贡献率分别为:29.112927.330310.76447.2713,即为它们的权重。再由不同面试方面所对应的因子数我们可以得到公因子得分和综合得分。(二)第二题:1、实验原理:主成分分析是由皮尔逊在1901 年首先对非随机变量引入的,后来由霍特

9、林在1933 年推广到随机向量的情形。主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量 )的多元统计方法,这些主成分能够反映原始变量的大部分信息,且新主成分之间相关性低、重叠少。主成分分析在很多领域都有广泛的应用,一般来说, 当研究的问题涉及多个变量,并且变量间相关性明显,即包含的信息有所重叠时,可以考虑用主成分分析的方法,这样更容易抓住事物的主要矛盾,使问题简化。具体做法是:对原始数据进行标准化处理用 x1 , x2 ,L , xm 表示主成分分析指标的m 个变量, 评价对象有n 个, aij 表示第 i 个评价对象对应于第 j 个指标的取值。将每个指标值aij 转化为标

10、准化指标a%ij ,即a%aijj ,( i1,2,L , n; j 1,2,L , m)ijsj式中: j1 naij , sj1n(aijj )2n i 1n 1 i1相应地,标准化指标变量为%x jj,( j 1,2,L , m)xjsj计算相关系数矩阵RR (rij )m mn% %akiakjrijk 1,( i , j 1,2,L , m)n1精选文库其中: rii1,rijr ji , rij 是第 i 个指标和第j 指标之间的相关系数。计算相关系数矩阵的特征值与特征向量解特征方程IR 0,得到特征值(1,2, );再求出相iiLm12L, m0对应的特征值 i的特征向量 ui (i1,2,L, m) ,其中 u j(u1 j , u2 j ,L, umj )T, 由特征向量组成的 m 个新的指标变量为y1%u11x1u21x2L um1 xmy2%u12x1u22 x2L um 2 xmMym%u1m x1u2 m x2L umm xm其中: y1 为第 1 主成分, y2 为第 1 主成分, ?, ym 为第 m 主成分选择 p(p m) 个主成分,计算综合评价值。( 1)计算特征值j ( j1,2,L , m) 的信息贡献率和累积贡献率用 bj 表示主成分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号