统计学聚类分析论文1

上传人:M****1 文档编号:501614518 上传时间:2023-11-28 格式:DOC 页数:6 大小:184KB
返回 下载 相关 举报
统计学聚类分析论文1_第1页
第1页 / 共6页
统计学聚类分析论文1_第2页
第2页 / 共6页
统计学聚类分析论文1_第3页
第3页 / 共6页
统计学聚类分析论文1_第4页
第4页 / 共6页
统计学聚类分析论文1_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《统计学聚类分析论文1》由会员分享,可在线阅读,更多相关《统计学聚类分析论文1(6页珍藏版)》请在金锄头文库上搜索。

1、200902034035金融一班刘志伟用聚类分析研究河南省各市三次产业就业人员差异化【摘要】随着市场经济的多元化发展,三次产业的人员分布情况发生着很大的变化,本文利用聚类分析方法,运用全国各地三次产业人员就业情况数据,分析了各地三次产业的就业情况和人员分布情况。【关键词】聚类分析;三次产业就业人员;分布情况1. 引言第一、第二、第三次产业,是根据社会生产活动历史发展的顺序对产业结构的划分。它大体反映了人类生活需要、社会分工和经济活动发展的不同阶段,基本反映了有史以来人类生产活动的历史顺序,以及社会生产结构与需求结构之间相互关系,是研究国民经济的一种重要方法。产品直接取自自然界的部门称为第一产业

2、,即农业,包括种植业、林业、牧业和渔业;对初级产品进行再加工的部门称为第二产业,即工业(包括采掘工业、制造业、自来水、电力、蒸气、热水、煤气)和建筑业;为生产和消费提供各种服务的部门称为第三产业,即除第一、第二产业以外的其他各业。根据我国的实际情况,第三产业可以分为两大部门:一是流通部门,二是服务部门。具体又可分为四个层次。第一层次:流通部门,包括交通运输业、邮电通讯业、商业饮食业、物资供销和仓储业;第二层次:为生产和生活服务的部门,包括金融、保险业,地质普查业,房地产、公用事业,居民服务业,咨询服务业和综合技术服务业,农林牧渔、水利服务业和水利,公路、内河(湖)航道养护业等;第三层次:为提高

3、科学文化水平和居民素质服务的部门,包括教育、文化、广播电视,科学研究、卫生、体育和社会福利事业等;第四层次:为社会公共需要服务的部门,包括国家机关、政党机关、社会团体,以及军队和警察等。2. 聚类分析方法聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。关键的思想去确定对分析目标有利的对象分类方法。这个思想已经用于许多领域,包括天文学、考古学、医药、化学、教育、心理学、语言学和社会学。在聚类分析前,首先把数据标准化为Z-分数,采用系统聚类(Hierachical Cluster)方法,用音差平方和法(Ward法)计算欧几里得(Eudlidean)距离。聚类分析依据的基本原则是:

4、直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下:其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,本节只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类

5、合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。应用系统聚类法进行聚类分析的步骤如下: 确定待分类的样品的指标; 收集数据; 对数据进行变换处理(如标准化或规格化); 使各个样品自成一类,即n个样品一共有n类; 计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类; 并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止; 最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。3. 实例分析本文以河南省各地区三次产业就业人员数(2006年)为研究

6、对象,运用聚类分析方法对产业分布情况进行评价。各市区按三次产业分就业人员数 (2006年底)市 区第一产业第二产业第三产业构成 (合计=100)第一产业第二产业第三产业全省3050.031350.571318.1253.323.623.0郑州市120.48127.85158.0629.631.538.9开封市178.2852.0753.4862.818.318.8洛阳市178.40106.1095.2047.027.925.1平顶山市162.1470.0874.5452.922.824.3安阳市162.5899.9067.0049.330.320.3鹤壁市35.4224.7721.4543.4

7、30.326.3新乡市149.7984.4755.4251.729.219.1焦作市85.8560.6749.5743.830.925.3濮阳市114.8566.1853.3449.028.222.8许昌市133.5677.0963.1248.828.223.1漯河市77.8643.3630.7351.228.520.2三门峡市66.2326.8930.9353.421.724.9南阳市353.86137.50147.4455.421.523.1商丘市291.9189.12100.2760.618.520.8信阳市237.1579.88134.4352.517.729.8周口市357.8214

8、6.68156.4454.122.223.7驻马店市308.2099.07129.7957.418.424.2济源市14.3711.5913.5736.429.334.3聚类案例处理汇总a,b案例有效缺失总计N百分比N百分比N百分比18100.00.018100.0平均联结(组之间)聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 211316180.95400142710377.16700531112406.55800104618678.9090013547860.771027689885.5730010745953.185509814171235.79700129242

9、082.3460711108112350.486631311232896.52090151214154844.415801413686121.4984101614131410857.76111217151212621.79801116161616465.4971513171711354117.35016140树状图 C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+南 阳 市 13 -+-+ 周 口 市 16 -+ +-+ 商 丘 市 14 -+-+ | | 驻 马 店 市 17 -+ +-+ | 信 阳 市 15 -+ | 鹤 壁 市 6 -+-+ |

10、 济 源 市 18 -+ +-+ | 漯 河 市 11 -+-+ | | | 三 门 峡 市 12 -+ +-+ | | 焦 作 市 8 -+-+ | | 濮 阳 市 9 -+ | | 新 乡 市 7 -+ +-+ 许 昌 市 10 -+ | 平 顶 山 市 4 -+ | 安 阳 市 5 -+-+ | 开 封 市 2 -+ +-+ | 洛 阳 市 3 -+ +-+ 郑 州 市 1 -+4、结论:由以上分析得知,三次产业人员就业情况河南省来说分两部分,第一部分包括13个城市,第二部分包括5个城市。第一部分的城市为郑州市,洛阳市,开封市,安阳市,平顶山市,许昌市,新乡市,濮阳市,焦作市,三门峡市,漯河市,济源市,鹤壁市。这13个城市都是我省主要的工业城市,人员就业主要集中在第一和第二产业,这是由城市的定位决定的。而其他的5个城市,南阳市,周口市,商丘市,驻马店市,信阳市,这几个城市是农业为主的城市,人口众多,大部分从事农业生产和外出务工,因此在这些城市里面,第一产业和第三产业的从业人数较多。而第二产业从业人员较少。用聚类分析研究河南省各市三次产业就业人员差异化专业班级:统计062班姓名:杨忠宏 学号:06110040227

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号