统计论文基于各省份农村居民消费结构的统计分析

上传人:ji****72 文档编号:27102085 上传时间:2018-01-07 格式:DOC 页数:24 大小:620.82KB
返回 下载 相关 举报
统计论文基于各省份农村居民消费结构的统计分析_第1页
第1页 / 共24页
统计论文基于各省份农村居民消费结构的统计分析_第2页
第2页 / 共24页
统计论文基于各省份农村居民消费结构的统计分析_第3页
第3页 / 共24页
统计论文基于各省份农村居民消费结构的统计分析_第4页
第4页 / 共24页
统计论文基于各省份农村居民消费结构的统计分析_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《统计论文基于各省份农村居民消费结构的统计分析》由会员分享,可在线阅读,更多相关《统计论文基于各省份农村居民消费结构的统计分析(24页珍藏版)》请在金锄头文库上搜索。

1、河 南 大 学数 学 与 信 息 科 学 学 院2013 2014 学 年 第 二 学 期统计软件和模型A实验论文基于各省份农村居民消费结构的统计分析编 号 58题目 基于各省份农村居民消费结构的统计分析姓名 牛建永 学号 1122313252年级 2011级 专业 计算机科学与技术成绩 合分人 牛建永摘要 针对农村居民消费状况,利用 2012 年各地区农村居民家庭平均每人生活消费支出数据,首先采用多元统计分析方法中的因子分析进行分析,用定义的深度函数和一般意义上的综合评价指标函数对其进行综合得分,根据综合得分结果对地区农村居民人均消费进行个案排秩和分类。得出北京,上海,浙江位居消费水平前三甲

2、。最后用对应分析方法分析各地区居民具体的消费方式及消费的比例。得出我国经济发达省区,浙江广东,江苏,福建等农村居民消费食品,居住,家庭设备,交通通讯为主;而天津,吉林,内蒙古,黑龙江等农村居民消费衣着,医疗保健,文教娱乐为主;北京,上海城市发达,农村居民消费水平高,几乎在所有方面消费都很高。而西藏甘肃,云南,贵州农村居民消费水平相似,在各个方面消费几乎都较低。关键词 农村居民 消费支出 深度函数 因子分析 对应分析1 研究背景及目的在中国改革开放的 30多年里,中国的面貌发生了翻天覆地的变化,中国在众多领域取得了举世瞩目的成就,在经济方面更是令国人感到骄傲和自豪,中国已达到世界第二大经济体。我

3、们知道投资,消费和出口是拉动经济的三驾马车,而消费水平不仅反映了当前的经济发展水平,还关系着社会经济活动的众多方面。我国居民消费方式也在发生着巨大变化。在居民全部消费支出的八项指标中,各项支出所占比例均有变化,生活质量整体有着显著的提高 1。随着经济全球化进程的加速,我们应抓住新一轮的发展机遇,迎接新的挑战,创造新的辉煌业绩。周所周知,周国国土面积较大,但各种资源分布很不均匀,城乡地区间贫富差距较大,消费水平差异更是很惊人。在过去的几十年里,中国一直靠投资和出口来发展自己的经济,内需不足。为缩小差距,实现中国经济又好又快的发展,在中共中央关于制定国民经济和社会发展第十二个五年规划的建议中,强调

4、“构建扩大内需长效机制,促进经济增长向依靠消费、投资、出口协调拉动转变。 ”“把扩大消费需求作为扩大内需的战略重点,进一步释放城乡居民消费潜力,逐步使我国国内市场总体规模位居世界前列。 ”由于农村居民消费水平分占据着重要的地位,在此情形下,析中国农村居民消费水平具有很重要的意义。 研究目的:通过分析中国农村居民消费水平情况,我们可以定性的得出发达地区和欠发达地区农村居民消费差距以及各地区在各消费方式下的消费比例,根据结果,我们可以向政府的经济政策提供宝贵的建议。2 研究方法该研究采用的指标有:食品,衣着 ,居住 ,家庭设备,交通通信,文教娱乐,医疗保健,其他等八项指标。分析方法:因子分析,对应

5、分析,深度分析等。基本思路:先把数据进行标准化,已消除单位和数量级的影响,接着进行因子分析,根据数据结果进行综合排名,然后在进行对应分析,出各地区在各消费方式下的消费情况进行归类。该研究采用的数据是2012年各地区农村居民家庭平均每人生活消费支出 ,数据摘自中国统计年鉴2013 11-24C。3 实证分析3.1 因子分析因子分析(Factor Analysis)的概念是由英国著名统计学家,心理学家查尔斯.皮尔逊(Chales .S .Pearson)于 1904年提出的。它的基本思想是通过对变量的相关系数矩阵的内部结构进行分析,从中找出少数几个能够控制原始变量的因子(选区公共因子的原则是尽可能

6、包含更多的原始变量信息) ,建立因子分析模型,利用公共因子在现原始变量之间的相关关系,达到简化变量,降低变量维数和对原始变量再解释及命名的目的。原始变量是可观测的显在变量,而因子一般是不可观测的潜在变量 2。设有 m个原始变量,表示为 x1 ,x2 ,xm ,根据因子分析的要求,假设这些变量已经标准化(均值为 0,标准差为 1) ,假设 m个变量可以有 n个因子 f1 , f2 , fn 表示为线性组合,即 上式为因子分析的数学模型,如果利用矩阵形式则表示为 AFX。其中 X为可观测的 n维变量向量,它的每一分量表示一个指标或变量; 称为因子向量,每一个分量表示一个因子,由于它们出现在每个原始

7、变量的线性表达式中,所以称为公共因子;矩阵 A为因子载荷矩阵,其元素 称为因子载荷;ija称为特殊因子, 表示原始变量中不能由因子解释的部分,均值为 03。KMO判断标准:0.9 KMO:非常适合。0.8 KMO 0.9:适合。0.7 KMO 0.8:一般。0.6 KMO0.7:不太适合。KMO 0.5:不适合。表 1 KMO 和 Bartlett 的检验结果(1)利用 SPSS软件,先对 15个指标的原始数据进行标准化处理,已消除量纲和数量级的影响,并得到各指标之间的相关系数矩阵 R.(2)KMO 和 Bartlett 的检验,如表1所示,KMO 的取值为0.780,表明变量间有相关性,数据

8、可以做因子分析。Bartlett 检验的 Sig.值为0.000,说明数据来自正态总体,适合进一步分析。 表2 初始解释总方差图1 碎石图 (3)由表2知,只有一个因子特征值大于1,用一个因子来解释原始变量效果不太理想。从图1中也可以看出,有两个因子解释原始变量较为合适。故把“抽取选项设置”对话框中特征值大于1选项改为要提取的因子为2。如图所示。 “ 抽取选项设置”对话框表3 初始共同度 表4 共同度表5 解释总方差(4)有表 3-表 5知,提取两个因子效果较好。各个指标信息损失较少。前两个公因子的方差总和占所有主成分方差的 87.130%,可见选取前两个因子已足够替代原来的变量。(5)由表

9、6知,初始因子载荷阵因子含义不明显,为此利用方差最大旋转,得到旋转后的因子载荷阵(如表 7) 。 表 6 成分矩阵表 7 旋转成分矩阵(7)这样每个因子就很明确了。根据表 7知,可将指标分为两类。第一个因子在衣着,医疗保健,文教育乐,其他,交通通讯上有较大的载荷,这些指标反映的是农村居民通常满足家庭基本消费后才考虑的消费方式,因此命名为生活附加因子。第二个因子在指标食品,家庭设备,居住上有较大的载荷,而这个因子反映的是家庭基本消费,故命名为基本因子。图 2也可以说明此分类比较合理 。 图 2 农村居民消费支出成分图表 8 因子得分矩阵表 9 成分得分协方差矩阵 通过表 8可得:F1(附加因子)

10、=-0.532*食品+0.598*衣着+(-0.121)*居住+(-0.180)*家庭设备+0.027*交通通信+0.260*文教娱乐+0.568*医疗保健+0.154*其他F2(基本因子)=0.731*食品+(-0.417)*衣着+0.314*居住+0.385*家庭设备+0.182*交通通信+(-0.057)*文教娱乐+(-0.387)*医疗保健+0.043*其他通过表9可见,各因子之间是正交的,即相互之间彼此独立。3.2 因子后续分析(1)当我们获得了各城市在两个公因子的得分后,就可以利用因子得分进行分类和排序。我们可以利用计算变量和排序来进行各城市的经济综合得分计算和排名,具体操作如图所

11、示。结论分析:观察“RF”一列,可以看出,北京、上海,浙江,是综合实力得分超过 1的城市。江苏,天津综合得分在 0.51之间。消费额也较大。它们构成农村居民消费前 5强。西藏,贵州,云南,甘肃和海南农村居民消费水平远低于它们的平均消费水平。(2) 深度分析作为一种多维的排序方法,已经被广泛应用于多元回归,聚类判别,风险度量等众多领域。统计深度函数为多维数据提供了一种从深度中心向外的排序方法,有深度函数的性质可知,靠近中心的数据深度较大,远离中心的数据深度较小。得到的综合得分函数越小,说明排名越靠前,反之亦然。 从 2个因子得分可以看出,由于西藏的 2各因子明显处于最低水平,利用这个特点,以西藏

12、的因子 Z深度中心,定义这里的深度函数为: 31,)(/),(1/),( iZMADdPDii其中 为定义的加权欧氏距离,即)(,Zdi5.02)(),(,21kjiki yZd其中 为样本 在因子 上的得分, 为第 k个 因子的方差贡献率,而 kiy,izf31,2),()( iZdmeianMAD即数列 的中位数 4。),(Zdi(3)运用 EXCEL可以算出和 , 和 值,通过深度函)(,i )(AD),(ZPi数计算出的综合得分结果如图所示。结论分析:由 RPDZiZ一列可以看出北京,上海,浙江农村居民消费居于前三甲,与江苏,广东构成前5。西藏,云南,甘肃,贵州农村居民消费水平较低。

13、说明:“RF”一列和“RPDZiZ”一列均采用个案排秩而得出的结果,具体操作如图所示。3.3 对应分析对应分析是 R型因子与 Q型因子分析的结合,他也是利用降维的思想已达到简化数据结构的目的,不过,与因子分析不同的是,他同时对数据表中的行与列将进行处理,寻求以低维图形表示数据表中行与列之间的关系。对应分析首先由理查森(Richardson)和库德(Kuder)在 1933年提出,后来有法国统计学家让保罗.贝内泽(Jean-Paul Benzecri)和日本统计学家林知己夫(Hayashi Chikio)对该方法进行了详细的论述而使其得到了发展 5。(1)首先建立新变量如图所示 (2)用消费值进

14、行加权,操作如图所示。 (3)打开“对应分析”工具条,点选 Model,在出现的对话框中选择数据标准化方法,点选 Euclidean,再选择 Column totals are equalized and means are removed 选项。其余选项默认。点击 OK运行。如图所示。其余工具条默认。 表 10 对应表表 11 行轮廓表 表 12 列轮廓表 表 13 结果汇总表表 13给出了行和列记分的关系,Proportion of Inertia 是惯量比例,代表各维度分别解释总惯量的比例及累计百分比,从中可以看出第一维和第二维的惯量比例占总惯量的 88.4%,因此可以选取两维来进行分析

15、。 图 3 行列得分图结论分析:从图中可以看出,我国经济发达省区,浙江,广东,江苏,福建等农村居民消费食品,居住,家庭设备,交通通讯为主;而天津,吉林,内蒙古,黑龙江等农村居民消费衣着,医疗保健,文教娱乐为主;北京,上海城市发达,消费水平高,几乎在所有方面消费都很高。而西藏甘肃,云南,贵州消费水平相似,在给个方面消费都较低。从我国目前的消费结构来看,大部分地区农村居民仍然以消费住房,医疗,食品,家庭设备方面,在城市发达地区,消费在住房,交通通讯,文教娱乐方面。随着我国社会经济的不断发展和进步,这种消费差异会逐渐减小,甚至会趋于一致。4 结论本文利用了多种统计学的方法对各地区进行了统计分析,总体上来说,从分析结果和中国现状来看,北京,上海农村居民消费一枝花,沿海地区农村居民消费也相当高,主要用在居住,家庭设备,交通通讯方面;西部地区经济相对落后,自然农村居民消费相对比较低。其他地

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号