多元统计分析报告

上传人:m**** 文档编号:507710242 上传时间:2023-03-16 格式:DOCX 页数:23 大小:131.91KB
返回 下载 相关 举报
多元统计分析报告_第1页
第1页 / 共23页
多元统计分析报告_第2页
第2页 / 共23页
多元统计分析报告_第3页
第3页 / 共23页
多元统计分析报告_第4页
第4页 / 共23页
多元统计分析报告_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《多元统计分析报告》由会员分享,可在线阅读,更多相关《多元统计分析报告(23页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析课程设计主成分分析法在我国居民生活质量状况综合评价中的应用姓 名:专业班级:学 院:数学与系统科学学院学 号:指导教师:山东科技大学2014 年 6 月 24 日目录摘要 11.问题及背景 21。1 背景提出 22 主成分分析概念与方法 23 主成分分析法在我国居民生活质量状况综合评价中的应用 43。1 原始数据 43.2 数据标准化 53。3 相关系数矩阵 63。4 特征方程及主成分确定 73。5 各特征值的单位特征向量 73.6 主成分值以及综合分值 73。7 各主成分上的得分 83.8 综合因子得分 103。 9 评价结果和排序 104。聚类分析 105 建议 11摘要改革开

2、放以来,我国各地区间的经济发展速度有着明显差别,而人民的生活质量也因此产生了不同,本文用主成分分析法、聚类分析法,选取职工人均工资(X ),人均居住面积1(X ),城市人口用水普及量(X ),城市煤气普及量(X ),人均拥有道路面积(X ),人均2 3 4 5绿地公共面积(X ),批发零售贸易商品销售总额(X ),旅游外汇收入(X )8个指标,以综6 7 8 合因子的贡献率确定主成分和权重, 计算出主成分分值值以及综合分值,对全国31 个省 市居民的生活质量进行了简单的分析,得到以下结论:根据31个省市的综合分值可以将居民生活质量状况按照降序进行以下排序:上海、广东、北京、江苏、浙江、福建、天

3、津、山东、重庆、辽宁、湖北、安徽、湖 南、江西、山西、河北、陕西、四川、新疆、广西、青海、河南、云南、贵州、内蒙古 宁夏、黑龙江、吉林、海南、甘肃、西藏。关键词主成分分析法、聚类分析法、居民生活质量状况、综合评价使用软件:SPSS 17.0Matlab 7.01。问题及背景1.1背景提出随着生产水平的的不断提高,我国居民生活水平不断提高,生活质量也在不断改进。 但是,受各地区生产力发展水平不平衡的影响,我国各地区居民生活质量也表现为不平衡。1.2 问题阐述基于以上背景,我们决定利用主成分分析法对我国 31个省市、自治区的居民生活质量状 况进行评价分析。为全面分析各地区居民生活质量的状况,特选取

4、如下的指标体系进行反映:职工人均工资(X ),人均居住面积(X ),城市人口用水普及量(X ),城市煤气普及量1 2 3(X ),人均拥有道路面积(X ),人均绿地公共面积(X ),批发零售贸易商品销售总额(X ),4 5 6 7旅游外汇收入( X )(符号下同)。通过对以上指标进行分析,从而对我国的居民生活质量状况8进行评价分析。2 主成分分析概念与方法2.1 主成分分析概念主成分分析是由卡尔和皮尔逊最早在 1901 年提出, 只不过当时是应用于非随机变量, 1933 年霍蒂林将这个概念推广到随机向量。该方法是利用降维的思想, 把多指标转化为 几个综合指标的多元统计分析方法。主成分分析的基本

5、原理 : 主成分分析是一种数学变换 的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量, 这些新的变量 按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变, 使第一变量具有 最大的方差, 称为第一主成分; 第二变量的方差次大, 并且和第一变量不相关, 称为第二 主成分;依次类推,k个变量就有k个主成分。通过主成分分析方法,可以根据专业知识和指 标所反映的独特含义对提取的主成分因子给予新的命名 , 从而得到合理的解释性变量。将 得到的主成分筛选、计算, 最终得到综合评价结果。2。 2 主成分分析法综合评价模型的基本步骤基于主成分分析法的综合评价是根据评价等级中各因子的参

6、数 , 通过主成分分析法的 计算, 得出基于主成分分析法的评价标准, 再将待评价的事物按照主成分分析法, 得出主 成分值及综合分值, 对照评价标准, 得出综合评价结果。 2.3主成分分析法综合评价模型的具体步骤如下:(1) 建立观测样本矩阵:xx1112xx21221 px2 p x xn1n 2 xnp -式中:n为样本数,p为变量数(2) 将原始数据标准化:为了排除数量级和量纲不同带来的影响, 采用以下公式对原始数据进行标准化处理.x - xx * = j,(i = 1,2,n; j = 1,2,,p)ij sj其中, r=1 几,s 2=丄区(x - r)2j n ij j n - 1i

7、j ji=1i =1(3) 建立变量的相关系数矩阵:R = (r ),不妨设R = XtXj pxp式中,r是指标X .与指标X之间的相关系数。ijij(4)计算特征方程:计算特征方程卜E - R = 0求解R的特征根九、九2、九 0及其相应的单位特征向量.其中,特征根为主成分Y的方差,方差越大,则对总方差的贡献越大。j(5)计算各个成分的方差贡献率: 计算各个成分的方差贡献率e =九 / 2L 九 x 100%j jjj=1贡献率解释了主成分 Y 所反映信息的大小, 贡献率最大的主成分为第一主成分, 其 j次为第二主成分, 以此类推。 选择主成分的个数取决于主成分的累计方差贡献率迟e ,m

8、= 1,2,pjj=1当 前 面 m 个 主 成 分 的 累 计 贡 献 率 大 于 85% 以 上 , 基 本 上 保 留 了 原 来 因 子X ,X ,X的信息,由此因子数将由p个减少为m个,从而起到筛选因子的作用。 12p 写出主成分, 即Y = a X + a X +a Xj 1j 12 j 2pj p(6)计算综合得分:将待评价事物的标准化数据代入各主成分的表达式中 , 计算得到待评价事物的各主成分值 Y , 以各主成分的方差贡献率 e 为权重求和, 即得到待评价事物的综合分值为: jjZ仝eYjjj=1( 7) 评价等级及标准:根据主成分分析法的评价标准, 结合待评价事物的综合分值

9、, 最终得到待评价事物所 属等级。3 主成分分析法在我国居民生活质量状况综合评 价中的应用31原始数据:表一 31 个地区八项指标的具体数据地区X1X2X3X4X5X6X7X8北京84742。0038.70100。 00100.007.5711。872420.995149.00天津61514。0028。31100。 00100。 0017.8810.54731.302226o 41河北38658。0030.7199.9699。7917。8414。001100O 51544.94山西44236。0026.5297。6495.1811.7910.82379。 53720.24内蒙古46557.00

10、21。4794.4384.3917.6715。5228 o 98771.96辽宁41858。0026。3998。4596。0211.5510。89986.283263.69吉林38407。0021.9492。3889.4612.6110.96156.24494o 77黑龙江36406.0021.7294。1483.3911.8311。75227o 59835.48上海78673.0060.48100。 00100。 004。087。083605o 565493o 23江苏50639.0044。0599。7099。4322。3513.634851o 526299o 72浙江50197。0060.

11、4899。8899.4917。8812。472302o 415151o 74安徽44601.0029.8898。0294.6118。4711.921501o 481562o 67福建44525。0046。1399。1398.6014。1312。101196.424225.67江西38512.0037.5697.6794.4014。9914.101010o 74484.73山东41904.0032.9899.8599。4824.7016.372459。 712923。 65河南37338。0031.6991.7677.9411。089.23806.17611.41湖北39846.0039.049

12、8.2495.0915.8510。501555.381202。 97湖南38971。0040.7296。4291.3313。498。83909。 92928。 36广东50278.0027.8997。6294.9313。4215。824908.6215610.67广西36386。0031。7595.3093.2614。7411.42841。 051278。 87海南39485。0022。8497。7492。1518。8512。01179。 74348.02重庆44498.0035.0393.8493。3210.6718.13975.471168。 32四川42339.0034.9492.048

13、7。9612。7210.79490.69798.15贵州41156.0025.2792。0771.356。809.3817。23168.94云南37629.0027.4494。3266.4611。9210.43472。 031947。 08西藏51705.0023.9775.3929.7914。229。401.98105.70陕西43073.0029。0096。1594。1114。7111.58279。 571597.47甘肃37679.0019.8792。7777。8112.569.52203.0422.35青海46483。0019.7899。9092.6511.179.8124。7224。32宁夏47436。0023。0692.3079.6717。5615.71123.335.45新疆44576.0022。7899.1396.6014。1610.00713.89550.57来源:中国统计年鉴20133.2数据标准化对表一中 31 个地区八项指标的具体数据进行标准化处理, 把数据转换为标准指标正 态分布,见表二:表二 31 个地区八项指标的标准化

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号