《应用多元统计分析习题解答主成分分析》

上传人:tang****xu5 文档编号:271284556 上传时间:2022-03-28 格式:DOCX 页数:8 大小:173.05KB
返回 下载 相关 举报
《应用多元统计分析习题解答主成分分析》_第1页
第1页 / 共8页
《应用多元统计分析习题解答主成分分析》_第2页
第2页 / 共8页
《应用多元统计分析习题解答主成分分析》_第3页
第3页 / 共8页
《应用多元统计分析习题解答主成分分析》_第4页
第4页 / 共8页
《应用多元统计分析习题解答主成分分析》_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《《应用多元统计分析习题解答主成分分析》》由会员分享,可在线阅读,更多相关《《应用多元统计分析习题解答主成分分析》(8页珍藏版)》请在金锄头文库上搜索。

1、主成分分析6.1试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取止。这就是主成分分析的基本思想。6.2主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”6.3简述主成分分析中累积贡献率的具体含义。答:主成分分析把P个原始变量Xi,X2,HI,Xp的总方差tr(2)分解成了P个相互独立的变量p个主成分的,忽略一些带有较小

2、方差的主成分将不会给总方差带来太大的影响。这里我们mPm(6.6已知X=(Xy&.X,的协差阵为21/45占/43/2SV5/431/411-1菸仕3/2JJ解:|!2E|二、叩2-X5/4=03/2SV3/4兰-A试进行主成分分析。计算得-*&=12Aj=8,M=4=D(YJ=扃=liDffj)=8,%)=4At=12(EfE)-20-2o73-10002v13-275v30痈05*1263-S4y33010V5-3418/-2V31-0一而/00山二(婿1,时同理,计算得Ag=8时,=(-2|化二4时,的=(0,-怀iy易知SpCt*)Ctj相互正交单位化向量得,任看=(狷湘.v一WVTf

3、VTV:一一-:-:-,;-1综上所述,L第一主成分为丫1二火+霭+我)=12244第二主成分为&=由+次+*购,8靠I第三主成分为与=一:为+;&DfYjH6.7设X=(Xw,Xp),的协方差阵(pXp)为0p1证明:Ai=a:l-p(l-p)为最大特征根,其对应的主成分为-Xper2pff:证明:|E-AE|=I厂P?IptJ2pa3cj2一(p-l)pa2+砂一土puz山pW(p-l)pa3+a:-1a:-1pff3U1(p-l)pa2lu3-Apa(p-l)pa:+ffs-Apazp/0-p)A心pff2n:,:0*0ff(lp)A7()P0=Kp-i)p+1G2为最大特征根当虹=(P

4、T)p+1JG:时,/。勺(If)阳=pff2/pfi-p)PP(P)9HiI:PpEa2p(l-p)-a2p(l-p):*pa2pCl-p)/%=am所以,-6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。单位:(亿元)行业名称资产总计固定资产净值平均余额产品销售收入利润总额煤炭开采和选业6917.23032.7683.361.6石油和天然气开采业5675.93926.2717.533877黑色金属矿采选业768.1221.296.513.8有色金属矿采选业622.4248116.421.6非金属矿采选业699.9291.584.96.2其它采矿业1.60.50.30解:令资产总

5、计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSSt这六个行业进行主成分分析的方法如下:1.在SPSS口中选择AnalyzesDataReductionFactor菜单项,调出因子分析主界面,并将变量Xi-X5移入Variables框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程(关于因子分子在SPS为实现的详细过程,参见7.7)。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。第一个因子就可以解释86.5%表6.1特征根和方差贡献率表解暮的总方差初始特征值捍取平方和莪人合计方差的嘛累粮防合计方差的累程供13.46086.499

6、96.4993.46086.49996.4992.53713.43499.S333.00299.9934.000.007100.000表6.2因子载荷阵成成馅1对.047.999X3.686乂47692.将表6.2中因子载荷阵中的数据输入SPS激据编辑窗口,命名为al。点击菜单项中的TransformsCompute,调出Computevariable对话框,在对话框中输入等式:z1=a1/SQRT3.46),计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。表6.3特征向量矩阵z1x10.509x20.537x30.530x40.413根据表6.3得主成

7、分的表达式:Y1=0.509X10.537X20.530X30.413X43.再次使用Compute命令,调出Computevariable对话框,在对话框中输入等式:y1=0.509*x10.537*x20.53*x30.413*x4根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。6.9下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对各主要食品和地区进行分类。牛肉猪羊其品重及制134.0592.789.1514.62.1710.134.252.9214.42150.26

8、9.991011.070.8410.88.350.7210.14216.7255.976.597.10.546.362.250.657.29218.9180.875.725.360.246.150.471.152.59207.370.772.7921.181.413.821.451.3410.77194.39178.595.916.452.519.594.490.7310.8255.99115.26.2711.423.238.643.60.7513.64195.08111.77.627.852.616.263.350.915.09189.4476.68.5916.377.47.5116.112

9、.1216.77251.98109.128.2712.054.56.729.091.38.82208.4683.915.8116.426.035.3314.642.1324.15228.3580.976.879.074.275.045.431.4210.61198.2799.925.1916.515.143.5513.32.3516.84264.8144.228.7713.243.313.55.191.137.31229.06118.196.968.092.711.614.01110.81236.97100.114.226.481.238.011.351.134.23227.39159.769

10、.419.862.743.868.10.927.29247.21149.448.3517.513.893.286.891.134.02233.75130.226.7322.2710.42.8313.32.163.33205.65108.944.9214.447.331.123.571.186.14236.3186.615.715.49.771.3114.751.243.88示津北西蒙宁林掰海苏江徽建西东南南北东西南町天河山内辽吉黑上江浙安福江山河湖湖广广海解:令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPS她行主

11、成分分析的具体方法参见6.8,分析结果如下:表6.4特征根和方差贡献率表雌寿的总方差成蜡初始特征值提职平方和戴人合计方差的累租合计方差的%12.92732.52132.5212.92732.52132.52122.22024.67157.1922.22024.6715719231.34414.93672.1281.3441493672.1284801890531.0335.6547.253382966.3964.39992,6941335372796.422e222247299.894e.1001.105100.000表6.5因子载荷阵123XI.002.G20-006姓.093-.477.715妇009.27680SX4780-.113.194对-.212064乂6-.503.608312X7.857177130X8.664.496-.151X9.241.735-.023表6.6特征向量矩阵z1z2z3x10.001169-0.55035-0.00518x20.054359-0.320140.616746x30.0052610.1852390.697829x40.455914-0.075840.167341x50.509689-0.14229-0.05521x

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号