基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)

上传人:QQ15****706 文档编号:52454254 上传时间:2018-08-21 格式:DOC 页数:15 大小:359.50KB
返回 下载 相关 举报
基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)_第1页
第1页 / 共15页
基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)_第2页
第2页 / 共15页
基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)_第3页
第3页 / 共15页
基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)_第4页
第4页 / 共15页
基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)》由会员分享,可在线阅读,更多相关《基于聚类分析的2011年前十大国别进出口总值的统计分析(范文)(15页珍藏版)》请在金锄头文库上搜索。

1、 武汉理工大学本科生课程设计论文基于聚类分析的 2011 年前十大国别 进出口总值的统计分析摘要本文在对2011年世界排名前十的国家进出口水平进行比较分析的基础上,通过运用聚类分析的方法,认为就经济层面上来讲,在国际贸易中处于重要地位的国家进口口总量占多,具有比较优势的国家会着重生产具有该比较优势的产品,并出口该产品。针对出口方面,美国和香港为一类,在国际经济中具有举足轻重的地位;对于进口方面,日本和韩国为一类,为主要进口大国,这与该国特殊的经济发展状况有关。关键词:系统聚类分析;离差平方和法;世界进出口贸易;比较优势The analysis of the summary of import

2、and export among the top ten nations in 2011 based on Cluster AnalysisAbstractThis article bases on the comparative analysis of the level of import and export which ranked top ten in 2011. Trough the cluster analysis method, we can get that ,from an economic sense, the countrys which play an importa

3、nt role in international trade will have more account for import or export.The one which has the comparative advantage will produces this products, and exports them.On the export side,America and Hongkong share one class, which play a decisive role; On the import side, Japan and Korea share one clas

4、s, which are mainly import great nations,These all are related to the special economic development.Key words:cluster analysis ; sum of deviation square method ; import and export trade in the world ; Comparative advantage 武汉理工大学本科生课程设计论文1 引言苏格兰哲学家大卫休谟1【】于 1758 年发表了贸易平衡论 (Of the Balance of Trade) ,其被

5、视为第一篇真正阐述了经济模型的论文。大约 20 年后,亚当斯密出版了国富论2【】。19 世纪早期,英国国内对其贸易政策进行了广泛的讨论,这些讨论在很大程度上促使经济学从一个散漫的非正式的领域转变成为了一个以模型为导向的学科。国际经济学的研究意义日渐重大。自从 1995 年 1 月 1 日世界贸易组织(WTO)的成立以来,随着国际商品和服务贸易的发展、国际间的资金流动,以及跨国投资的发展,各个国家之间的经济联系变得比以往任何时候都更加紧密。根据一些基本的贸易统计数据,如进出口额的变化即可反映跨国经济联系的重要意义。经济学历史上,针对国际贸易已有很多研究,有关进出口的主要模型有:李嘉图模型3【】、

6、特定要素模型4【】、HO 模型5【】以及标准贸易模型6【】等等。本文通过对 2011 年前十大主要进出口国别各月份的进出口额进行分析,其中分别对出口类国别和进口类国别,应用系统聚类分析的方法设法将这些主要出口国别聚成了 2类,将主要进口国别聚成了 3 类。按国别聚类,可以根据具体贸易量来分析国家在世界中的经济往来是否占主导地位。2 系统聚类分析基本原理2.1 聚类分析方法7【】聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合,严格的数学定义是较麻烦的,在不同的问题中类的定义是不同的。聚类分析起源于分类学,随着生产技术和科学的发展,人类

7、的知识不断加深,分类越来越细,要求也越来越高,有时光凭经验和专业知识是不能进行确切分类的,往往需要定性和定量分析结合起来分类,于是数学工具逐渐被引进分类学中,形成了数值分类学,后来随着多元分析的引进,聚类分析又逐渐从数值分类学中分离出来而形成一个相对独立的分支。聚类分析的方法:系统聚类法、模糊聚类法、k-均值法、有序样品聚类等。本文以系统聚类的方法进行分析。2.2 系统聚类的基本思想假设n个样品它们各自为一类,并对样品间的距离和类与类之间的距离做出规定。首先计算样品间的距离,将距离最小的类并为武汉理工大学本科生课程设计论文一类,即将那些最为相似的对象首先分组;计算并类后的新类与其它类的距离,即

8、将距离最小的两类并为一类,这样每次减少一类;最后随着相似性不断下降(类间距离不断加大) ,所有的组渐渐融合为一个聚类。由于类与类之间距离定义方法不同,因而产生不同的系统聚类方法,如最短距离法、最长距离法、中间距离法、类平均法和离差平方和法。2.3 系统聚类的基本步骤(1)计算个样品之间的距离,共有个。得样品间的距离矩阵,初始个nijd2 nC(0)Dn样品各自构成一类,类的个数,此时类间的距离就是样品间的距离。kn(2)选择表中最小的非零数,不妨假设,于是将pG和qG合并为一类,记为(0)Dpqd,rpqGG G(3)利用递推公式计算新类与其它类之间的距离。分别删除表的第,行和(0)Dpq第,

9、列,并新增一行和一列添上的结果,产生表。pq(1)D(4)在表再选择最小的非零数,其对应的两类有构成新类,再利用递推公式计(1)D算新类与其它类之间的距离。分别删除表的相应的行与列,并新增一行和一列添上(1)D的新类和旧类之间的距离。结果,产生表。类推直至所有的样本点归为一类为止。(2)D2.4 离差平方和法(Ward)本文选择离差平方和法。这个方法是 Ward 提出来的,故又称为 Ward 法。设将个样品分成类:,用表示中的第i个样品(注意nk1G2GkG( ) t iXtG是维向量) ,表示中的样品个数,是的重心,则中样品的离差平方和( ) t iXptntG( ) tXtGtG为:武汉理

10、工大学本科生课程设计论文(1)( )( )( )( )1() ()tntttt ttt iSXXXX个类的类内离差平方和为:k(2) ( )( )( )( )111() ()inkktttt ttt ttiSSXXXXWard 法的基本思想是来自于方差分析,如果分类正确,同类样品的离差平方和应当较小,类与类的离差平方和应当较大。具体做法是先将个样品各自成一类,然后每次缩n小一类,每缩小一类离差平方和就要增大,选择使增加最小的两类合并(因为如果分类S正确,同类样品的离差平方和应当较小)直到所有的样品归为一类为止。如果将与的距离定义为pGqG(3)2 pqrpqDSSS其中,就可以使 Ward 法

11、和其它系统聚类方法统一起来,且可以证明rpqGGGWard 法合并类的距离公式为:(4)2222kpkqk krkpkqpq rkrkrknnnnnDDDDnnnnnn3 指标体系的建立与实证分析3.1 指标体系的建立本文以世界进出口排名前十的国家为单位,采用2011年一到十二月各月份的横截面数据进行分析8【】。出口额数据中,指标记=一月金额,=二月金额,=三月金额,=十二月金1X2X3X12X额;进口额数据中,指标记=一月金额,=二月金额,=三月金额,=十二月1Y2Y3Y12Y武汉理工大学本科生课程设计论文金额。具体数据如下:表 1. 2011 年出口主要国别(地区)总值单位:亿美元出口最终

12、目的国一月金额二月金额三月金额四月金额五月金额六月金额七月金额八月金额九月金额十月金额十一月金额十二月金额美国香港日本韩国德国荷兰印度英国新加坡俄罗斯联邦252.1204.5115.767.662.444.139.233.830.529.6157.9151.081.947.341.229.925.520.218.919.2251.0220.6131.478.159.647.340.833.834.934.7255.8234.6121.273.661.847.839.733.633.029.3258.4224.1109.974.764.045.840.334.132.331.8280.0235.

13、8122.068.664.648.241.034.630.635.4299.6232.3127.868.576.160.348.743.331.838.4300.9222.8132.265.875.457.950.143.530.238.7301.1222.2136.177.167.056.546.842.728.935.4286205.6126.568.463.551.145.340.226.534.5309.4246.5141.775.264.853.946.942.230.634.6293.4280.2137.964.564.352.341.239.331.335.4表 2. 2011

14、年进口主要国别(地区)总值单位:亿美元进口 原产国一月金额二月金额三月金额四月金额五月金额六月家呢七月金额八月金额九月金额十月金额十一月金额十二月金额日本 韩国 美国 台湾 中国 德国 澳大利亚 马来西亚 沙特阿拉伯 巴西162.8133.2116.5107.5100.573.772.449.936.436.7128.196.378.475.262.449.844.931.73428.6187.7141.1120.7112.7101.787.358.357.442.631.7159.9134.7109.5104.9101.280.961.451.438.732.3144.6132.199.91

15、08.398.482.262.25240.249.2158.713389102.4101.676.466.254.939.839.6161.8133.590.7103.6103.476.551.551.841.351.8175145.8100.7111.7110.885.47458.44255.2178.9148.2101.4110.3106.585.883.656.539.754.8155.113985.395100.168.670.45044.247.9162.5146.3114.9105.4119.884.482.651.947.450.6171.9143.5118.9107.4118.

16、776.872.954.649.244.53.2 实证分析武汉理工大学本科生课程设计论文3.2.1 出口最终目的国的聚类表 3.Ward 联结聚类表聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 21234567898864614311097582643.030.080.135.206.363.7201.1922.0765.877010030406000020578255779890输出表 3.是反映每一阶段聚类的结果,系数表示聚合系数,第 2 列和第 3 列表示聚合的类,比如第一阶段时,第 8 组(英国)和第 10 组(俄罗斯联邦)聚为一类;第 8 组(英国)和第 9 组(新加坡)聚成一类等等。武汉理工大学本科生课程设计论文图 1 案例输出图 1 是由柱状图反映聚类的情况。柱高越低则说明两组距离越短,即该两组可以聚为一类;柱高越高则说明两组距离越大,即该两组不宜聚为一类。如图 1,俄

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 论文指导/设计

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号