SPSS基于农村居民家庭人均生活消费支出分析

上传人:宝路 文档编号:3029202 上传时间:2017-07-30 格式:DOC 页数:15 大小:579KB
返回 下载 相关 举报
SPSS基于农村居民家庭人均生活消费支出分析_第1页
第1页 / 共15页
SPSS基于农村居民家庭人均生活消费支出分析_第2页
第2页 / 共15页
SPSS基于农村居民家庭人均生活消费支出分析_第3页
第3页 / 共15页
SPSS基于农村居民家庭人均生活消费支出分析_第4页
第4页 / 共15页
SPSS基于农村居民家庭人均生活消费支出分析_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《SPSS基于农村居民家庭人均生活消费支出分析》由会员分享,可在线阅读,更多相关《SPSS基于农村居民家庭人均生活消费支出分析(15页珍藏版)》请在金锄头文库上搜索。

1、1SPSS基于农村居民家庭人均生活消费支出分析摘要:随着社会经济的快速发展和新农村建设的不断推进,我国农村经济社会得到了又好又快的发展,农民生活水平也得到了很大的提高,但是,由于我国各省市的经济背景、社会背景和环境背景等都存在着这样或那样的差异,从而导致了生活消费水平也参差不齐。为了客观的了解我国农村居民的总体消费水平和生活现状,本文运用spss软件中的各种分析方法对我国农村居民的人均消费情况进行科学的分析。关键字:消费支出 频数分析 参数检验 非参数检验 聚类分析 恩格尔系数引言:改革开放以来,中国经济的发展迅速,在社会主义市场经济的运作过程中,消费不仅可以满足人的多方面的欲求,而且,也会促

2、进生产的发展,它所表现出的历史规定性,可以折射出不同社会阶段中消费关系的本质特征。我国人口众多,而且一半以上的人口在农村,农村居民的消费水平逐渐成为了制约我国经济发展的重要影响因素,因此,加强对农村居民的消费水平和消费结构的研究,不仅有利于改善我国农村居民的消费现状,而且对拉动我国经济增长有重要意义。2010 年 2 季度农村居民家庭个人现金收入统计(分地区)2一、数据的与处理在数据文件建立好后,通常还需要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。首先,为了便于数据的浏览,快捷的找到数据的最大值和最小值,同时,快捷的发现数据的异常值,先将数据按照降序重新进行

3、排列;其次,为了粗略的把握数据的分布,实现数据的离散化处理和对数据进行频数分析,和对数据进行频数分析,利用spss软件中的分组功能对数据进行简单的分组。由于变量值较多,分组适应采用组据分组的方式,具体步骤如下:1、确定组数: k=1+ln(n)/ln2=1+ln31/ln2=62、确定组距: 组距=(最大值-最小值) /组数=(8844.88-1913.71)/6=1155.2034二、基本统计分析频数分析利用spss先前已经对数据做好的分组,通过频数分析,可以进一步了解分组后的消费支出合计取值的状况,进而准确的把握数据的分布特征。分析结果如下:统计量分组后的消费支出合计有效 31N缺失 0表

4、1-2(a)分组后的消费支出合计频率 百分比有效百分比累积百分比1.00 18 58.1 58.1 58.12.00 9 29.0 87.13.00 1 3.2 3.2 90.34.00 1 3.2 3.2 93.55.00 1 3.2 3.2 96.86.00 1 3.2 3.2 100.0有效合计 31 100.0 100.0表1-2(b)5表1-2(c)已知,全国31个省市按照消费合计总共被分成了6组,从表1-2(b)中可以得出:第一组的省市最多,共有18个,所占比率为58%;第二组有9个,所占比率为29% ;而剩下的组都只有1个省市,所占比率均为3.2% 。由于在表格中不存在缺失值,因

5、此频数分布表中的百分比和有效百分比相同。从此次分析中可以看出,我国农村家庭居民人均消费的总体水平比较集中, 大约在2000元-3000元之间,还有少数省市的消费水平处在中等阶段,而只有上海、北京、浙江等一些经济较发达的地区的农村家庭居民人均消费达到了6000元以上。也就是说,我国农村家庭消费总水平还处在比较低的阶段。三、spss的参数检验单样本的t检验由表1-3 可知,分组后,全国31个省市的农村家庭居民平均每人生活消费支出合计,大约有18个城市都集中在第一组,数额主要1913.71元-3065.44元之间,因此可推断,全国农村家庭居民平均每人生活消费支出的平均数应该在1913.71元-306

6、5.44元之间,假设为2600元,由于该问题涉及的是单个总体,且要进行总体均值检验,同时农村家庭居民平均每人消费的总体可近似认为服从正态分布,因此,应采用单样本t检验来分析推断全国农村家庭居民人均消费的平均值是否为2600元。分析结果如下:单个样本统计量6N 均值 标准差均值的标准误生活消费支出合计31 3376.30871499.61216269.33830表1-3(a)单个样本检验检验值 = 2600 差分的 95% 置信区间t dfSig.(双侧) 均值差值 下限 上限生活消费支出合计2.882 30 .007 776.30871226.24651326.3709表1-3(b)由表1-4

7、 可知31个省市的农村居民人均消费支出的平均值为3376.3087元,标准差为1499.61216元,均值标准误差为269.3383元。表1-5中,第二列是t统计量的观测值为2.882;第三列式自由度为30(即n-1=31-1);第四列是t 统计量的观测值的双尾概率P-值;第五列为样本均值与检验值的差,即t 统计量的分子部分,它除以表1-4中的均值标准误差后得到t统计量的观测值;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(226.2465,1326.3709),由此计算出总体均值的95%的置信区间为(2826.2465,3926.3709)元。该问题应采用双尾检验,因此比较a/

8、2和p/2 ,是比较a 和p。如果a给0.05,由于p大于a,此应接受原假设,认为全国农村家庭平均每人生活消费支出的平均数与2600元无显著差异。四、非参数检验多配比样本分参数检验在数据分析过程中,假设无法对总体分布形态作出简单的假设,但又希望能从样本数据中获得尽可能多的信息,基于此,我们可以利用非参数检验对数据进行分析。数据中我国农村家庭居民人均消费包括食品、衣着、居住、家庭设备、交通及通讯、文教娱乐、医疗保健、和其他8个指标,为了比较清楚的了解这8项指标对我国农村居民人均消费总体的影响,以及其大概的消费动向,可以利用多配比样本的非参数检验对各个指标进行检验。检验结果如下:7秩秩均值食品支出

9、 8.00衣着支出 3.23居住支出 7.00家庭设备及服务支出2.23交通和通讯支出5.58文教娱乐用品及服务5.13医疗保健支出 3.77其他商品及服务支出1.06检验统计量 aN 31卡方 202.473df 7渐近显著性.000a. Friedman 检验表1-4(b)表1-4(a)由表7-30 可以得出这八种消费方式下消费额的平均轶,Friedman检验统计量的观测值为202.473,相应的概率P-值为0。如果显著性水平a为0.05,由于概率P-值小于显著性水平a ,因此应拒绝原假设,认为不同消费形式下的消费额数据的分布存在显著差异,其中食品消费占得比重最多。也就是说,在8项指标中,

10、消费指标对我国农村居民人均消费总额的影响最大。 19世纪德国统计学家恩格尔根据统计资料,对消费结构的变化得出一个规律:一个家庭收入越少,家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭总支出中用来购买食物的支出比例则会下降。推而广之,一个国家越穷,每个国民的平均支出中用于购买食物的支出所占比例就越大,随着国家的富裕,这个比例呈下降趋势。这就是用来描述食品支出总额占个人消费支出总额的比重的恩格尔系数(Engels Coefficient)。利用spss的计算功能求出各个省市的恩格尔系数:恩格尔系数()=食物支出金额总支出金额100。 然后制作各省市恩格尔系数的Bar ch

11、art,其结果如下:8图1-4由图1-4 可知,我国31个省市的恩格尔系数总体均在30%-60% 之间,其中大约有20个省市处在30%-50%之间,10个左右的省市在30%-40%之间。20世纪70 年代是,联合国粮农组织将恩格尔系数作为衡量一个国家和地区富裕程度的标准之一:恩格尔系数在50%以上为贫困, 50%-59%为温饱,40%-50%为小康,30%-40%为富裕,低于30%为最富裕。对比我国2007年31个省市的恩格尔系数,可以得出:我国大多数省市农村居民都达到小康水平,一部分省市已经处于富裕阶段,但是,仍然还有少数省市仅仅只是解决了温饱问题而已。五、聚类分析K-Means 聚类聚类分

12、析在统计学中主要研究的是“物以类聚”的问题,它包括层次聚类和 K-Means 聚类。但是由于层次聚类虽然能够得到多个解,起执行效率却不是十分理想,而 K-Means 聚类则能有效地解决该问题。K-Means 聚类又称快速聚类,是将数据看成 k 维空间上的点,仍以距离作为测度个体“亲疏程度”的指标,并通过牺牲多个解为代价换得高的执行效率。它与层次聚类不同,K-Means 聚类是一个反复迭代的反类过程,在聚类过程中,样本所属的类会不断调整,直到最终达到稳定为止。其分析结果如下:初始聚类中心聚类1 2 3生活消费支出合计8844.886801.601913.71食品支出 3259.482430.60

13、998.39衣着支出 475.51 405.32 99.44居住支出 2097.211498.50329.64家庭设备及服务支出451.40 338.80 70.939交通和通讯支出883.71 782.98 154.52文教娱乐用品及服务857.47 750.69 147.31医疗保健支出 571.06 452.44 79.31其他商品及服务支出249.04 142.26 34.16表1-5(a)最终聚类中心聚类1 2 3生活消费支出合计8844.885995.672882.73食品支出 3259.482177.331273.40衣着支出 475.51 390.02 184.12居住支出 2

14、097.211091.48491.81家庭设备及服务支出451.40 302.49 128.06交通和通讯支出883.71 701.82 288.83文教娱乐用品及服务857.47 754.44 255.49医疗保健支出 571.06 448.62 194.56其他商品及服务支出249.04 129.47 66.44表1-5(b)表1-5(a)和表1-5(b)展示的是3个类的初始类中心和最终类中心的情况,由表1-5(a)可知第一类指标均为优秀,第二类次之,第三类最不理想;观察表1-5(b)可以看出同样的结论,可以说明样本所属的类较稳定。每个聚类中的案例数1 1.0002 3.000聚类3 27

15、.000有效 31.000缺失 .000表1-5(c)ANOVA聚类 误差均方 df 均方 df F Sig.生活消费支出合计2.853E7 2 371387.00528 76.829 .000食品支出 2841914.4982 80598.85428 35.260 .000衣着支出 92711.244 2 4334.964 28 21.387 .000居住支出 1641111.9612 27164.17028 60.415 .00010家庭设备及服务支出86349.819 2 1064.931 28 81.085 .000交通和通讯支出378544.3182 7533.278 28 50.2

16、50 .000文教娱乐用品及服务483570.4532 8515.729 28 56.786 .000医疗保健支出 146779.0642 6086.492 28 24.116 .000其他商品及服务支出20401.701 2 550.341 28 37.071 .000F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。表1-5(d)表1-5(c)展示了3个类的类成员情况,第一类有1个省(上海),其消费情况处于上游水平;第二类有3个省(浙江、北京和江苏) ,其消费情况处于处于水平;第三类包括剩余27个省组成,其消费水平最不理想。从分析中我们可以得出,我国绝大多数省市农村家庭居民的消费水平比较低,消费结构不合理。表1-5(d)中展示的是各个省市的各个指标在不同

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号