聚类分析在经济中的应用

上传人:s9****2 文档编号:498120658 上传时间:2023-04-18 格式:DOCX 页数:22 大小:429.53KB
返回 下载 相关 举报
聚类分析在经济中的应用_第1页
第1页 / 共22页
聚类分析在经济中的应用_第2页
第2页 / 共22页
聚类分析在经济中的应用_第3页
第3页 / 共22页
聚类分析在经济中的应用_第4页
第4页 / 共22页
聚类分析在经济中的应用_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《聚类分析在经济中的应用》由会员分享,可在线阅读,更多相关《聚类分析在经济中的应用(22页珍藏版)》请在金锄头文库上搜索。

1、精选优质文档-倾情为你奉上编号:4本科毕业论文题目:方差分析在农业中的应用院 系:数学科学系姓 名:徐进辉学 号:专 业:信息与计算科学年 级:2011级指导教师:陈 敏职 称:助教完成日期:2015年5月专心-专注-专业摘 要近年来,河南省城镇由于商业,工农业,教育等方面的发展,带动了各城镇居民家庭消费支出.为探讨河南省城镇居民的消费结构,本文应用SPSS统计分析软件,对河南省18个地市级城市居民的消费结构进行了聚类分析,结果表明,河南省的18个城市按照消费结构的不同主要分为三大类:较高层次消费,中等层次消费,较低层次消费.关键词:消费结构;相关分析;聚类分析AbstractIn recen

2、t years, due to the development of commercial, industrial and agricultural, and education and so on, the town of Henan province drives the consumption expenditure of urban households. In order to study the consumption structure of urban residents in Henan province, in this paper, we will use cluster

3、 analysis on 18 prefecture-level city residents consumption structure of Henan province through SPSS statistical analysis software, and the results show that, according to the consumption structure, the 18 cities in Henan province can be divided into three different categories: high level consumptio

4、n, moderate level consumption, low level consumption.Keywords: consumption structure; correlation analysis; cluster analysis目 录)1 引言近年来,河南省宏观经济形势发生了重大变化,经济发展速度加快,城镇居民的收入稳定增加,并且在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,河南省各地市城镇居民的消费支出也强劲增长,消费结构发生了巨大的变化,结构不合理现象得到了一定程度的调整.我省经济持续快速发展,人民生活水平不断提

5、高,消费市场规模不断扩大,消费加速转型.由原来的简单的数量增长演变为数量增长与结构调整并行,消费开始升级,由食品衣着居住、家庭设备用品及服务、医疗、交通、文化教育、娱乐和旅游产业链不断演化,消费结构向更高层次转变.河南省作为一个重要的经济建设区,经济健康高速的发展,离不开消费市场的稳定发展和消费结构的升级优化.消费结构的合理和居民消费行为的科学文明将对经济的发展有很大的促进作用.消费结构的的变化趋势对经济增长有着很大的关系,合理的消费结构将会对促进我省经济的增长有很大的帮助作用.因此,对消费结构的探讨有利于了解我国居民消费结构的特征,从而制定合理的经济政策,促进经济增长.通过查阅文献及数据对2

6、012年河南省各城镇居民消费结构有了一定的了解,田隽在中国居民消费结构变化趋势研究1中采用结构分析法和扩展线性支出系统(ELES)模型等方法,量化分析出我国居民消费结构所呈现的总体变化趋势,即从基本生存型消费向享受、发展型消费转变。将研究视角定位在我国居民消费尤其是城镇居民消费上,着重研究可以量化分析的居民消费结构。魏宝滨在中国城乡居民消费结构变动对比分析2中采用定性与定量、静态与动态相结合的分析方法,着重研究了近十年来我国城乡消费结构演变及发展趋势,归纳了城乡消费结构自身特点及差异状况。运用ELES模型对城乡居民消费倾向、收入弹性、价格弹性进行了研究,并采用灰色系统对城乡消费水平及结构进行预

7、测。胡丽平、何春花在河南省城镇居民消费结构变动的实证分析3中运用因子分析模型,对河南省城镇居民家庭人均消费性支出状况进行了实证分析,并提出了拉动河南消费需求的政策建议.虽然关于城镇居民家庭消费支出的研究已取得丰硕的成果,以往的研究也表明,对城镇居民消费结构的研究主要集中在全国及个别省份上,所采用的分析方法及结论也不尽相同,因此,本文拟从以往研究出发,采用多元统计分析中的聚类分析,并借助SPSS统计分析软件4建立模型,运用系统聚类法,对我省各个城市居民的消费结构之间的异同进行分析并做比较研究并加以分类,以期发现河南省18个城市在消费结构上的特点和规律,从而提出相关的建议,采取切实有效的措施增加城

8、市居民的可支配收入,提高河南省城市居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展.2 预备知识2.1 聚类分析的概念聚类分析5指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程.其目标就是在相似的基础上收集数据来分类.聚类是将到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性.从统计学的观点看,聚类分析是通过简化数据的一种方法.传统的统计聚类分析方法包括法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等.从实际应用的角度看,聚类分析是数据挖掘的主要任务之一.而且聚类能够作为一个独立的工具获得数据的分布状况,

9、观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析.2.2聚类分析的原理相类似性是定义一个类的基础,不同数据之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的,由于特征类型和特征标度的多样性,必须谨慎,它经常依赖于应用,例如,通常通过定义在特征空间的距离度量来评估不同对象的相异性,很多距离度都应用在一些不同的领域,一个简单的距离度量,如距离,经常被用作反映不同数据间的相异性,一些有关相似性的度量,例如和,能够被用来特征化不同数据的概念相似性,在图像聚类上,子图图像的更正能够被用来衡量两个图形的相似性.将数据对象分到不同的类中是一个很重要的步骤,数据基于不同的方法被分到不同的类中,划分

10、方法和层次方法是聚类分析的两个主要方法,划分方法一般从初始划分和最优化一个聚类标准开始.它的每一个数据都属于单独的类;它的每个数据可能在任何一个类中,和是划分方法的两个主要技术,划分方法聚类是基于某个标准产生一个嵌套的划分系列,它可以度量不同类之间的相似性或一个类的可分离性用来合并和分裂类.评估聚类结果的质量是另一个重要的阶段,聚类是一个无管理的程序,也没有客观的标准来评价聚类结果,它是通过一个类有效索引来评价,一般来说,性质,包括类间的分离和类内部的耦合,一般都用来评价聚类结果的质量,类有效索引在决定类的数目时经常扮演了一个重要角色,类有效索引的最佳值被期望从真实的类数目中获取,一个通常的决

11、定类数目的方法是选择一个特定的类有效索引的最佳值,这个索引能否真实的得出类的数目是判断该索引是否有效的标准,很多已经存在的标准对于相互分离的类数据集合都能得出很好的结果.2.3聚类分析的模型设我们测得了个变量的组数据: (2-1)这个变量的个观测记为中的个向量,和以前一样并写成矩阵形式,还称为个变量的观测样本.常用 (2-2)来描述变量,间的相关性,并称之为,的相关系数,其中,此外,还常用 (2-3)来描述变量,间的相关程度,为和前者区别,我们称(2-3)为,的相似系数.其几何意义就是在中两向量,的夹角余弦,如果对(2-2)式引进向量表示,则式(2-2)也表示两向量的夹角余弦.两者都是从不同角

12、度描述变量,的相近程度.有时为了简单,也可用两个变量,的观测向量在对应分量上的同号率(数符相同的比值)来衡量它们的相似程度,即设和相应分量和同号的个数,和相应分量和异号的个数,则同异号差率为, (2-4)我们称为变量,的非参数相关系数.相应的,设和相应分量和同号的个数,和相应分量和异号的个数,则同异号差率为 (2-5)我们把叫做变量,的非参数相似系数.当变量,的观测向量各分量均大于零时,还常用以下的相似系数, (2-6)以上各相关系数(或相似系数)具有以下两个共同性质:1.,对一切,;2.,对一切,.而且越接近 1,越相关或相似,越接近零,越不相关或不相似.特别地,对于和还有,当时还有(时有)

13、,即与(与)是有通常的线性相关;当时,为通常的正交关系(时,为通常的正交关系).还可以用其他方法来定义变量的相关程度,但一般都需要满足以上两个条件.下面我们用变量的样本来描述这一概念.取,这两个点(或称为向量),除了可用相似(或相关)来衡量它们的相近程度外,还可用距离来衡量.最常用的距离有以下几种:(1) 欧式距离.沿用上面的记号,定义,的欧氏距离为:. (2-7)(2) 距离.定义为, (2-8)其中为一正整数.(3) 距离.定义为. (2-9)(4) 马氏距离.定义为 , (2-10)其中,这里,而且要求是可逆的.(5) 兰氏()距离.定义为. (2-11)这种距离一般在都同号情况下使用以

14、上各种距离定义可类似用于队的列,以衡量两个变量,的相似程度越小意味着,越相近,特别地,如果,则表示两者在相应的距离意义下完全相同.越大,意味着两者相差越远.还有一点值得注意的是,在泛函分析中定义的距离要求满足距离公理,即满足:(1) ,当且仅当时;(2),对一切,;(3),对一切,.在聚类分析中引进的距离并不要求这一点.2.4聚类分析的特征聚类分析是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类.它的原则是同一类中的个体有较大的相似性,不同类的个体差异性很大.这种方法有三个特征:(1) 适用于没有先验知识的分类.如果没有这些事先的经验或一些、,分类便会显得随意和主观.这时只要设定比较完善的分类变量,就可以通过聚类分析法得到较为科学合理的类别;可以处理多个变量决定的分类.例如,要根据消费者购买量的大小进行分类比较容易,但如果在进行时,要求根据的购买量、家庭收入、家庭支出、年龄等多个指标进行分类通常比较复杂,而聚类分析法可以解决这类问题;(2) 聚类分析法是一种探索性分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号