第六章多元统计分析答案

上传人:l****i 文档编号:265095366 上传时间:2022-03-12 格式:DOC 页数:6 大小:562KB
返回 下载 相关 举报
第六章多元统计分析答案_第1页
第1页 / 共6页
第六章多元统计分析答案_第2页
第2页 / 共6页
第六章多元统计分析答案_第3页
第3页 / 共6页
第六章多元统计分析答案_第4页
第4页 / 共6页
第六章多元统计分析答案_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《第六章多元统计分析答案》由会员分享,可在线阅读,更多相关《第六章多元统计分析答案(6页珍藏版)》请在金锄头文库上搜索。

1、.6.1 试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据维数的同时又保留了原数据的大部分信息。6.3 简述主成分分析中累积贡献率的具体含义。答:主成分分析把

2、个原始变量的总方差分解成了个相互独立的变量的方差之和。主成分分析的目的是减少变量的个数,所以一般不会使用所有个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们称为第个主成分的贡献率。第一主成分的贡献率最大,这表明综合原始变量的能力最强,而的综合能力依次递减。若只取个主成分,则称为主成分的累计贡献率,累计贡献率表明综合的能力。通常取,使得累计贡献率达到一个较高的百分数如85以上。6.4 在主成分分析中原变量方差之和等于新的变量的方差之和是否正确? 说明理由。答:这个说法是正确的。即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行

3、主成分分析的区别。答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在大数吃小数的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替。对于研究经济问题所涉及的变量单位大都不统一,采用R代替后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。6.6 已知X=的协差阵为试进行主成分分析。解:=0计算得当时,同理,计算得

4、时,易知相互正交单位化向量得, ,综上所述,第一主成分为第二主成分为第三主成分为6.7 设X=的协方差阵p为 , 0p1证明:为最大特征根,其对应的主成分为 。证明:=, 为最大特征根当时,=所以,6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。单位:亿元行业名称资产总计固定资产净值平均余额产品销售收入利润总额煤炭开采和选业6917.23032.7683.361.6石油和天然气开采业5675.93926.2717.533877黑色金属矿采选业768.1221.296.513.8有色金属矿采选业622.4248116.421.6非金属矿采选业699.9291.584.96.2其它采矿

5、业1.60.50.30解:令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSS对这六个行业进行主成分分析的方法如下:1. 在SPSS窗口中选择AnalyzeData ReductionFactor菜单项,调出因子分析主界面,并将变量移入Variables框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程关于因子分子在SPSS中实现的详细过程,参见7.7。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。第一个因子就可以解释86.5%表6.1 特征根和方差贡献率表表6.2 因子载荷阵2. 将表6.2中因子载荷阵中的数据输入SPS

6、S数据编辑窗口,命名为a1。点击菜单项中的TransformCompute,调出Compute variable对话框,在对话框中输入等式:z1=a1 / SQRT,计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。表6.3 特征向量矩阵z1x10.509 x20.537 x30.530 x40.413 根据表6.3得主成分的表达式:3. 再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式: 根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金

7、属和其他采矿业。6.9 下表是我国20XX各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对各主要食品和地区进行分类。地区粮食蔬菜食油猪牛羊肉家禽蛋类及其制品水产品食糠酒134.0592.789.1514.62.1710.134.252.9214.42150.269.991011.070.8410.88.350.7210.14216.7255.976.597.10.546.362.250.657.29218.9180.875.725.360.246.150.471.152.59蒙207.370.772.7921.181.413.821.451.3410.77194.39178.595.

8、916.452.519.594.490.7310.8255.99115.26.2711.423.238.643.60.7513.64195.08111.77.627.852.616.263.350.915.09189.4476.68.5916.377.47.5116.112.1216.77251.98109.128.2712.054.56.729.091.38.82208.4683.915.8116.426.035.3314.642.1324.15228.3580.976.879.074.275.045.431.4210.61198.2799.925.1916.515.143.5513.32.

9、3516.84264.8144.228.7713.243.313.55.191.137.31229.06118.196.968.092.711.614.01110.81236.97100.114.226.481.238.011.351.134.23227.39159.769.419.862.743.868.10.927.29247.21149.448.3517.513.893.286.891.134.02233.75130.226.7322.2710.42.8313.32.163.33广西205.65108.944.9214.447.331.123.571.186.14236.3186.615

10、.715.49.771.3114.751.243.88解:令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.4 特征根和方差贡献率表表6.5 因子载荷阵表6.6 特征向量矩阵z1z2z3x10.001169-0.55035-0.00518x20.054359-0.320140.616746x30.0052610.1852390.697829x40.455914-0.075840.167341x50.509689-0.14229-0.05521x6-0.329

11、080.4080630.269126x70.5009210.1187950.112136x80.3881120.332893-0.13025x90.1408660.4933-0.01984根据表6.6得主成分的表达式:分别计算出以上三项后,利用公式得到综合得分并排序如下表:地区y1y2y3y14.92 -90.42 67.81 -10.16 11.80 -93.48 54.76 -15.31 24.39 -115.46 57.85 -16.51 24.55 -129.93 68.56 -19.17 25.14 -126.00 59.51 -19.43 19.55 -154.56 118.72

12、-19.47 13.27 -131.90 76.07 -23.38 23.53 -169.91 108.84 -24.97 29.80 -167.06 88.93 -25.29 广西19.18 -144.89 72.06 -25.99 蒙15.93 -130.47 48.84 -27.33 24.93 -154.57 60.04 -29.19 11.81 -152.64 81.06 -30.09 21.71 -179.61 100.93 -30.74 14.06 -143.12 56.46 -30.92 18.07 -164.93 76.08 -32.51 7.10 -129.83 40.94

13、 -32.73 6.20 -141.44 55.18 -34.15 14.54 -166.90 78.26 -34.32 18.74 -185.62 97.04 -34.94 8.32 -156.36 66.62 -35.93 最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。6.10 根据习题5.10中20XX我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.7 特征根和方差贡献率表表6.8 因子载荷阵表6.6 特征向量矩阵z1z2x10.29 0.47 x20.28 0.48 x30.14 -0.29 x40.31 -0.37 x50.40

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号