分层聚类分析报告

上传人:M****1 文档编号:565046843 上传时间:2022-09-17 格式:DOCX 页数:17 大小:172.06KB
返回 下载 相关 举报
分层聚类分析报告_第1页
第1页 / 共17页
分层聚类分析报告_第2页
第2页 / 共17页
分层聚类分析报告_第3页
第3页 / 共17页
分层聚类分析报告_第4页
第4页 / 共17页
分层聚类分析报告_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《分层聚类分析报告》由会员分享,可在线阅读,更多相关《分层聚类分析报告(17页珍藏版)》请在金锄头文库上搜索。

1、课程论文题目:基于系统聚类分析的我国不同省市之间农产品种植结构比较分析院(系):数学与统计学院专业年级学生姓名:学号:指导教师:刘翠霞职称:讲师日 期 :20121005摘要:在国家统计局尖于农产品种植面积的统计指标基础上,采用层次聚类分析我国不同省市之间农产品种植结构比较分析,并得出各主要聚类群。在此基础上认为目前我国农产品种植情况还是以粮食种植为主,各地区各地区农产品种植结构均有不同情况矢键词:层次聚类分析种植结构地区比较、弓言农业实力是我国综合实力发展所要解决的一个非常重要的问题。众所周知,我国是农业大国,现阶段全球粮食库存跌破安全警戒,主要粮食种 植面积 下降;同时人口增长以及生物能源

2、的快速发展,带来 粮食需求的刚 性上涨,致 使世界粮食供求紧张,另外我国的种植行业 其生产方式仍以家 庭作业为主,产 业化程度较低,这注定了农业中的种植行业在农产品涨价 的过程中受益程度相 对有限。我们非常有必要按照种植产物的不同种类将 种植情况趋同的地区进行 分类,找到并了解当前我国的农产品种植结构的 差异与共性。二、模型选择 层次聚类分析是一种多元数理统计方法。它并没有事先设定样本分类 的标 准,而是通过对样本和变量数据的不同特征指标值进行差异 程度计算, 根据变 量或样本间不同的差异程度大小重新结合分类,产生一个更有效的 分类。其优 点在于可以对分类变量进行聚类,提供的距离测量方法和结果

3、 表示方法也非常 丰富。它的实现过程如下:1. 由于本文所选用数据存在大量的量纲,所以必须进行无量纲化处 理。2. 将各组数据作为独立的一类(设为 n 类),按照系统聚类分析 的重心法 距离计算各数据点之间的距离,形成一个距离阵3. 将距离最近的两组数据并为一类,从而形成 n-1 个类别,计算新 产生 的类别与其他各个类别之间的距离或者相似度,形成新的距离阵。这 种方法的 思想来自于方差分析,使用该方法的目的是使得各个 类别间的样 本量尽可能接 近。4. 按照与第二步相同的原则,再将距离最接近的两个类别合并,一直 重复该步骤直到所有数据被合并为一个类别为止。三、实证分析1. 数据来源及变量说明

4、。按照国家统计口径的划分,将种植种类划分 为 七类:粮食种植、瓜果种植、蔬菜种植、棉花种植、烟叶种植、油料种 植、糖 料种植。以上所有指标数据,均来自中国农村统计年鉴原始数据 或换算得 到。2. 结果解释。根据模型实现过程,通过多次聚类可以得出谱系图 (Dendrogram) 由于篇幅限制,在此就不再逐步进行了,只给出最后结 果。在谱系图中,聚类的全过程可以直观的表现岀来,它把类间的最大 距离算 做相对距离为 25, 其余的距离均换算成与之相比的相 对距离大小。3. 结果的验证和进一步说明。以下是层次聚类分析产生的结果,我们 在 确定分类过程中,总是希望能够进行“等分”,所以从表 1 中可以直

5、观 的看 到,将 31 个省份分为四类相对合适,这个时候最大的类别和特点突出 的类别都 划分较为明确,适合进一步的分析差异,以及各个类别具有怎么样的特征。表 2 中可以看出,各个类别 之间 在各变量上都是有显著差异的,且这种差异具有统计意义。原始数据葩区粮胃 瓜果 蔬葉 棉花 烟草 油料 糖料北京6EE02,6024700,600 002.200 00大津67.501.7023.4015.300.00 900.00河北70 B01.2012 80M00 006.100.20山西81701.00B. 402 900.105.900.1070 900 804 000.0001010.600 80辽

6、宁83.800 909.500.000.304.200 00吉林36 801.004 300.000.505.800.10黒龙江B6.2D1.203.200.000.304.101.10上海41.205.5033.900.300 006W0 40辽苏65 501 7015 304.700 0010700 00浙江53.504 0023.600.600.108 300 5071 001.907.704 300 1012.600.10福建57.301.5026.200.002.805.000.60迁西65 901.6010.401 200.3010900.30III东63 402 5016 20B

7、. 700.308.100 00河南2J012 205601 0010900 00湖北55.301.3013.805 500.8018.400.10湖南59 501.5013.002 101.3011.400.20东57 201.0024 500.000.70B503.40广西51 601 2D1750 000 404.8013 00海南54 103.1023 000.000.005.208.1071.600 5012000 001.407.40.10四川60.100 5012.200.300.9011.100.3064.000 5010,200 004.0011 600.40云南69.500

8、.308.500.006.303.704.70西藏73.700.008.100.00 0010 400 00映西77 601.408.402.000.806 300.00甘肃69.401 109.502.000.408.700.10青海53,100 105.700 000 0032.600 00新疆/U 6039U64UUUUU. UU/3UU UU39 2U1?9U4.9U33 2UU. UU4 UU2.50案例处理汇总Case Processing Summary?CasVaidMissNPercentN31100.00;esJi ngTOtaiPercentNPercent.031100

9、.0a.b. Centroid Linkage1/85.540D0162310.500005101511 9600010131917.6500014142820 535208452722 44000113022.560009 122D間5013斗5102623 10810121530 7E0J0174631 360601651232.8S6901351429.37812820111336.5220418132440.07000194752.0631112631052.63101019112154.60214022318697001715203565.9S9191321325104.398200

10、2411115017401823120197.24722025317281 79521026122E7.2342302734301.6G224162S19385.251250261350S. 715272629129371.84428030l311787.303290012345E7e9101112131415161713192021222324252S27屈2930冰状图IP用匕化一乩一怛 -总 21 D=snQJOIqumNIS20-2530*树状图5“苍西西宁西川棗摯醫暑香东北南北建东鲁脣津海臺 g吉黒LLI陕辽江四甘重内宁西安 胡M工可n可云相嚼亠折每比亠天上青所下面我们将主要根据树状

11、图进行分析,由图可知如何对各城帀分类 四、结论与结果分析1 如果分为两类第一类:新疆自治区第二类:其他城市2如果分为三类城市第一类:新疆自治区第二类:青海第三类:其他城市如果分为四类城市 第一类:新疆自治区第二类:青海第三类:福建,广东、浙江、海南、北京、广西、天津、上海第四类:其 他 城市。4. 如果分为五类第一类:新疆自治区第二类:青海第三类:上海第四类:福建,广东、浙江、海南、北京、广西、天津第五类:其他城 市。详细分析分为四类的情况第一类:新疆自治区归为一类棉花的种植在其种 植 结构中占据了重要 的比重。第二类:青海省归为一类,其种植的特征不明显。第三类:福建,广东、 浙 江、海南、北京、广西、天津、上海八个省市归为一类,经济作物在其 种植 中占据了较大比例。第四类:其他城市,归为一类,粮食作物在其种植结构中占统治地位。通 过 聚类分析我们可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号