主成分分析实验

上传人:人*** 文档编号:510620681 上传时间:2022-09-11 格式:DOCX 页数:4 大小:108.72KB
返回 下载 相关 举报
主成分分析实验_第1页
第1页 / 共4页
主成分分析实验_第2页
第2页 / 共4页
主成分分析实验_第3页
第3页 / 共4页
主成分分析实验_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《主成分分析实验》由会员分享,可在线阅读,更多相关《主成分分析实验(4页珍藏版)》请在金锄头文库上搜索。

1、主成分分析实验1:数据Employee data.sav中为银行在1969-1971年之间雇员情况的数据,共包括474条观测及如下10各变量:本例中需要用到的变量分别为Educ ,Salary,Salbegin,Jobtime,Orevexp。下面我们用主成分分析法处理该数据,一起用少数变量来描述该地区居民的雇佣情况。打开数据Employee data.sav,依次选 分析降维因子分析) 丹析(也直傲匝)图形2) 实用程序帮I棍告:以表比蛟均值(四一段线性模型(2) 广文技性模型展台模型09用剁9回愈对数技性模型神皎网婚点击。胸即可,输出为:卜 公 信因子方差给出了该次息损獭大外,主成sala

2、ryJ21.9M5,0$32,1$36.0$21,9J27.9J24.0J30.3-3每个原始变量中提取的信息,可看出除受教育程度量至少90%的信息。jobcat1分几乎包含了各个原始变公因子方差初始提取Educational Level (years)1.000.754Current Salary1.000.896Beginning Salary1.000.916Months since Hire1.000.999Previous Experience (months)1.000.968提取方法:主成份分析。解释的总方差显示了各主成分解释原始变量总方差的情况,默认保留特征根大于1的主成分,本

3、例保留3个主成分,集中了原始5各变量信息的90.66%,可见效果比较好。解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%12.47749.54149.5412.47749.54149.54121.05221.04670.5871.05221.04670.58731.00320.07090.6561.00320.07090.6564.3657.29997.9555.1022.045100.000提取方法:主成份分析。实际上,主成分解释总方差的百分比也可以由公因子方差表计算得出,即 (.754+.896+.916+.999+.968) /5=90.66%,成分矩阵给出了

4、标准化原始变量用求得的主成分线性表示的近似表达式,以 current Salary 一行为例,用prin1,prin2,prin3来表示个各主成分,得到: 标准化的 S alary0.940*prin1+0.104*prin2+(2.857E-02)*prin3.成份矩阵a成份123Educational Level (years).846-.194-.014Current Salary.940.104.029Beginning Salary.917.264-.077Months since Hire.068-.052.996Previous Experience-.178.965.069(m

5、onths)提取方法:主成份。a.已提取了 3个成份。在上面的主成分分析中,SPSS默认是从相关矩阵出发求解主成分,且默认保留特征根大于 1的主成分,实际上,对主成分的个数,我们可以自己确定,方法为:选择“抽取一一因 子的固定数量”可以输入别的数值来改变SPSS软件保留特征根的大小。另外,还可以直 接确定主成分个数。在实际进行注册号那个分分析时可以先按照默认设置做一次主成分分 析,然后根据输出结果确定应保留主成分的个数,用该方法进行设定后重新分析。由成分矩阵中的结果可以得到:0.9402 + 0.9172 + (6.806E - 02)2 + (0.178)2 + 0.8462 = 2.477

6、031 =第一主成分的方差。又有 0.9402 + 0.1042 + (2.857 E - 02)2 = 0.896这恰好与公因子方差表中三个主成分提取Salary变量的信息相等,重做一遍主成分,此次 将5个主成分全部保留,成份矩阵a成份12345Educational Level (years).846-.194-.014.496.008Current Salary.940.104.029-.234.222Beginning Salary.917.264-.077-.183-.225Months since Hire.068-.052.996-.013-.026Previous Experi

7、ence-.178.965.069.174.038(months)提取方法:主成份。a.已提取了 5个成份。对上表中接过由如下关系式:0.9402 + 0.1042 + (2.857E - 02)2 + (0.234)2 + 0.2222 = 1还可得到标准化原始变量用各主成分线性表示的精确的表达式:Salary=0.940*prin1+0.104*prin2+(2.857E-02)*prin3-0.234*prin4+0.222*prin5由默认选项输出的结果,我们还不能得到用原始变量表示出主成分的表达式,要 得到这个结果及其他一些有用的结果,就需要对模块中的设置作调整。方法如下:得分一一显

8、示因子得分系数矩阵。15如血因子得丹系数危阵(叫Employee Code id Gender gender Date of Birth bdate Employment Category . Minority Classification .商述回.袖取握锌C0.膈输出成份得分系数矩阵成份123Educational Level (years).342-.184-.014Current Salary.380.099.028Beginning Salary.370.250-.077Months since Hire.027-.050.992Previous Experience-.072.91

9、7.069(months)提取方法:主成份。上表给出了用原始变量表示主成分的系数信息,因为系统默认是从相关矩阵出发 进行分析,所以,上面表格中的系数是将原始变量标准化后表示主成分的系数, 也就是说,有下式成立:标准化 prin1=0.342* 标准化 educ+0.380* 标准化 Salary+ 0.370* 标准化 salbegin+ 0.027* 标准 化jobtime- 0.072* 标准化 prevexp应当注意,此处给出的用原始变量表示主成分的表达式得到的是标准化后的主成 分,也就是说,这样求得的主成分方差是1.,而不是原始变量相关矩阵的各个特 征根,如前所述,第一主成分的方差是2.477,而用上式求得的主成分方差为1, 要得出为标准化的主成分与原始变量的表达式,只需将给出的系数前面乘以主成 分方差的平方根即可,为标准化第一主成分与原始变量的关系式如下:prin1=0.342 *2477 *标准化educ+0.380 *寸2477 *标准化Salary+ 0.370*0.477 *标准化salbegin+ 0.027 *(2.477 *标准化jobtime- 0.072 *2.477 *标准化 prevexp。类似可写出第二,第三主成分用标准化后的原始变量表示的表达式。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号