毕业设计(论文)中期报告-张晓-110059

上传人:ali****an 文档编号:119082687 上传时间:2020-01-05 格式:DOC 页数:8 大小:789KB
返回 下载 相关 举报
毕业设计(论文)中期报告-张晓-110059_第1页
第1页 / 共8页
毕业设计(论文)中期报告-张晓-110059_第2页
第2页 / 共8页
毕业设计(论文)中期报告-张晓-110059_第3页
第3页 / 共8页
毕业设计(论文)中期报告-张晓-110059_第4页
第4页 / 共8页
毕业设计(论文)中期报告-张晓-110059_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《毕业设计(论文)中期报告-张晓-110059》由会员分享,可在线阅读,更多相关《毕业设计(论文)中期报告-张晓-110059(8页珍藏版)》请在金锄头文库上搜索。

1、河北工业大学本科毕业设计(论文)中期报告河北工业大学2015届本科毕业设计(论文)中期报告毕业设计(论文)题目:山东省居民消费结构变动分析专业(方向):信息与计算科学 学生信息: 110059、张晓、信计111指导教师信息:仝策中、讲师报告提交日期:2015.5.101、课题进展情况 (1)学习恩格尔系数分析方法。(2)学习因子分析,聚类分析的分析方法及应用原理。(3)学习并尝试应用spss软件对数据进行分析 2、相关理论2.1恩格尔系数分析法2.1.1定律说明:食物开支占总消费数量比重越大,恩格尔系数越高,生活水平越低;反过来,食物占比重越小,恩格尔系数越低,生活水平就越高。整个社会经济发展

2、水平越高,用于食物消费部分支出的比重就越小。2.1.2公式:食物支出变动百分比食物支出对总支出的比率(R1)= 总支出变动百分比或食物支出变动百分比食物支出对收入的比率(R2)= 收入变动百分比(R2又称为食物支出的收入弹性)。恩格尔定律是根据经验数据提出的,它是在假定其他一切变量都是常数的前提下才适用的,因此在考察食物支出在收入中所占比例的变动问题时,还应当考虑城市化程度、食品加工、饮食业和食物本身结构变化等因素都会影响家庭的食物支出增加。只有达到相当高的平均食物消费水平时,收入的进一步增加才不对食物支出发生重要的影响。恩格尔系数是根据恩格尔定律得出的比例数,是表示生活水平高低的一个指标。其

3、计算公式如下:恩格尔系数=食物支出金额/总支出金额除食物支出外,衣着、住房、日用必需品等的支出,也同样在不断增长的家庭收入或总支出中,所占比重上升一段时期后,呈递减趋势。不同收入水平的家庭,其食品支出在总的消费支出中的比重不同:收入水平越低的家庭,其食品支出比重越高;收入水平较高的家庭,其食品支出比重较低。在其他条件不变的情况下,随着收入水平的提高,食品支出占总消费支出的比重有逐渐下降的趋势。国际上常常用恩格尔系数来衡量一个国家和地区人民生活水平的状况。根据联合国粮农组织提出的标准,恩格尔系数在59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于30%为最富裕。在

4、我国运用这一标准进行国际和城乡对比时,要考虑到那些不可比因素,如消费品价格比价不同、居民生活习惯的差异、以及由社会经济制度不同所产生的特殊因素。对于这些横截面比较中的不可比问题,在分析和比较时应做相应的剔除。另外,在观察历史情况的变化时要注意,恩格尔系数反映的是一种长期的趋势,而不是逐年下降的绝对倾向。它是在熨平短期的波动中求得长期的趋势随着时间的推移,以后的经济学家又对恩格尔定律做了若干补充,恩格尔定律的内容有所增加。目前西方经济学对恩格尔定律的表述如下:1、随着家庭收入的增加,用于购买食品的支出占家庭收入的比重(即恩格尔系数)会下降。2、随着家庭收入的增加,用于家庭住宅建设和家务经营的支出

5、占家庭收入的比重大体不变。3、随着家庭收入的增加,用于服装、交通、娱乐、卫生保健、教育方面的支出和储蓄占家庭收入的比重会上升。2.2因子分析2.2.1因子分析的基本思想因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。对于所研究的某一具体问题,原始变量分解为两部分之和。一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。2.2.2 因子分析的数学模型设有个指标,则因子分析数学模型为:其中,是已标准化的可观测的评价指标。出现在每个指标的表达

6、式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。是各个对应指标所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。是指标在公共因子上的系数,称为因子载荷,因子载荷的统计含义是指标在公共因子上的相关系数,表示与线性相关程度。用矩阵形式表示为:其中,称为因子载荷矩阵。其统计含义是:中的第行元素说明了指标依赖于各个公共因子的程度。中第列元素说明了公共因子与各个指标的联系程度。故常根据该列绝对值较大的因子载荷所对应的指标来解释这个公共因子的实际意义。中的第行元素的平方和称为指标的共同度。中第列元素的平方和表示公共因子对原始指标所提供的方差贡献的总和,衡量各个公共因子的相对重要

7、性。称为公共因子的方差贡献率,越大,公共因子越重要。2.2.3 因子分析的步骤1 将原始变量数据进行标准化处理;2 计算标准化指标的相关系数矩阵;3 求解相关系数矩阵的特征向量和特征值;4 确定公共因子的个数,设为个,即选择特征值1的个数或根据累积方差贡献率85的准则所确定的个数为公共因子个数;5 求解初始因子载荷矩阵;设从相关矩阵出发求解主成分,设有个变量,则可以找出个主成分,将所得的个主成分由大到小排列,记为,则主成分与原始变量之间有其中是随机变量的相关矩阵的特征值所对应的特征向量的分量,特征向量之间正交,从到的转换关系的可逆得到由到的转换关系只保留前个主成分,而把后面的个主成分用特殊因子

8、代替,即为了把转化为合适的公因子,需要把主成分变为方差为1的变量,故令,则设样本相关系数矩阵的特征值为,其相应的标准正交特征向量为,设,则因子载荷矩阵的一个估计值为:共同度的估计为:。6 建立因子模型,其中为公共因子,为特殊因子。7 对公共因子进行重新命名,并解释公共因子的实际含义当初始因子载荷矩阵难以对公共因子的实际意义作出解释时,先要对作方差极大正交旋转,然后再根据旋转后所得的正交因子载荷矩阵作出解释,即根据指标的因子载荷绝对值的大小,值的正负符号来说明公共因子的意义。8 对初始因子载荷矩阵进行旋转由于因子载荷矩阵不唯一,旋转变换可以是使初始因子载荷矩阵的每列或每行的元素的平方值趋于0或1

9、,从而使得因子载荷矩阵结构简化,关系明确。如果初始因子之间不相关,公共因子的解释能力能够用其因子载荷平方的方差来度量时,则可采用方差极大正交旋转法;如果初始因子之间相关,则需要进行斜交旋转,通过旋转后,得到比较理想的新的因子载荷矩阵。9 将公共因子变为变量的线性组合,得到因子得分函数,系数,均为标准化的原始变量和公共因子。因子得分函数的估计值为其中为因子载荷矩阵,为原始变量的相关矩阵,为原始变量向量。10 求综合评价值,即总因子得分估计值为其中时第个公共因子的归一化权重。即:11 根据总因子得分估计值就可以对每个被评价的对象进行排名,从而进行比较。2.3聚类分析2.3.1 K_Means聚类法

10、的核心步骤2,10聚类法也称快速聚类,它将数据看成维空间上的点,仍以距离作为测度个体“亲疏程度”的指标,并通过牺牲多个解为代价换得高的执行效率。1.指定聚类数目。在聚类中,应首先要求用户自行给出需要聚成多少类,最终也只输出关于它的唯一解。2.确定个初始类中心。在指定了聚类数目后,应需要指定这个类的初始类中心点。中系统会根据样本数据的具体情况选择个有一定代表向的样本作为初始类中心点。3.根据距离最近原则进行分类。依次计算每个样本数据点到个类中心点的欧式距离,并按照距个类中心点距离最短的原则将所有样本分派到个分类中。欧式距离:两个体间的欧式距离是两个体个变量值之差的平方和的平方根,数学定义为: (

11、2.6)式中,是的第个变量的变量值;是个体的第个变量的变量值。4.重新确定个类中心。依次计算各类中个变量的均值,并以均值点作为K个类的中心点。5.判断是否已经满足终止聚类分析的条件。聚类分析终止的条件有两个:1.迭代次数。当目前的迭代数等于指定的迭代次数(默认为10)时终止聚类。2.类中心偏移程度。新确定的类中心点距上次迭代形成的类中心点最大偏移量小于指定的量(默认为0.02)时终止分类。满足上述条件中任意一个就可以终止分类。3、阶段性成果山东省居民消费结构变动分析3.1数据整理3.2恩格尔系数分析19931999年:恩格尔系数快速下降,城乡居民生活步入小康阶段。这一时期,山东经济步入快速发展

12、的关键时期。医疗改革、住房改革、教育改革逐步展开。特别是1997年亚洲金融危机爆发后,为促进经济增长,我国实行了积极的财政政策和扩张性货币政策,推出消费信贷,鼓励人们购房买车,居民消费结构出现了较大变化。家用电脑、空调、移动电话开始走进寻常百姓家,居住支出、医疗保健支出、交通和通讯支出、教育文化娱乐服务支出出现快速增长,致使城乡居民恩格尔系数均呈快速下降态势。1993年城镇居民恩格尔系数率先降至50%以下,达到46.0%,1998年又下降至40%以下,为39.6%;1999年农村居民恩格尔系数也下降到50%以下,达到48.8%,城乡居民生活水平均得到较大幅度的提升。2000年至今:城镇居民恩格

13、尔系数波动徘徊,农村居民恩格尔系数持续下降,城乡居民生活步入富裕的门槛。从城镇看,恩格尔系数呈现波动态势,始终在33%上下波动,没有明显下降,个别年份受物价因素影响,特别是食品价格明显上涨的影响,甚至出现小幅反弹。2000-2013年间,城镇居民恩格尔系数高于33%的年份有8年,低于33%的年份有6年,可以说进入了一个较长时间的波动徘徊期。从农村看,恩格尔系数呈现持续下降态势,由2000年的44.2%下降到2013年的34.5%,累计下降9.7个百分点。4、目前存在的问题和后续工作的安排本阶段数据处理只是刚刚开始进行, 一些分析方法和软件的应用还没有实际的掌握,对于数据的分类整理还存在修改和扩

14、充的地方,需要进一步完善。对于数据结果的分析还需要查阅有关资料进行验证和对比。在下一阶段的学习和工作中,能够将数据分类更加科学和完善,对各项分析方法能应用自如,从而得到更科学和详细的分析结果并应用到日后的分析工作中。希望在今后的学习工作中能够继续端正态度,更加认真地研究,保质保量的完成论文初稿。参考资料:1山东统计年鉴_刘兴慧主编_第2篇国民经济核算_2_61978_2013年居民消费.2高鸿业.宏观经济学M.中国人民出版社.20043穆南天.我国居民消费结构分析及对策J.20094李兴绪,殷溪源,石磊.SPSS经济统计分析M.中国统计出版社.20085贾俊平,郝静.统计学案例与分析M.中国人民大学出版社.20106孙彩虹.我国城镇居民消费结构变动的因子分析J.重庆工商大学学报.200727邓菲.因子分析在我国城镇居民消费结构变动的应用J.20081145-468侯寒冰,宋永发.基于K-means聚类分析的地铁施工风险评价方法J.大连理工大学.20119张永利,王佳秋,张丽娟.基于聚类分析的城市居民和农村居民收入变化J.黑龙江科技学院.200910何晓群.多元统计分析M.中国人民大学出版社. 8

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号