毕业论文统计学本科 多元回归分析中变量的选择

上传人:枫** 文档编号:510688721 上传时间:2023-01-09 格式:DOCX 页数:32 大小:202.23KB
返回 下载 相关 举报
毕业论文统计学本科 多元回归分析中变量的选择_第1页
第1页 / 共32页
毕业论文统计学本科 多元回归分析中变量的选择_第2页
第2页 / 共32页
毕业论文统计学本科 多元回归分析中变量的选择_第3页
第3页 / 共32页
毕业论文统计学本科 多元回归分析中变量的选择_第4页
第4页 / 共32页
毕业论文统计学本科 多元回归分析中变量的选择_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《毕业论文统计学本科 多元回归分析中变量的选择》由会员分享,可在线阅读,更多相关《毕业论文统计学本科 多元回归分析中变量的选择(32页珍藏版)》请在金锄头文库上搜索。

1、毕业论文题 目多元回归分析中的变量选取SPSS的应用院(系)数学与统计学院专业年级2010级统计学学生姓名 殷婷 学号 2010101217指导教师 职称 副教授日 期2014-4-22多元回归分析中的变量选取一一SPSS的应用殷婷摘要本文不仅对于复杂的统计计算通过常用的计算机应用软件SPSS来实现,同时通过 对两组数据的实证分析,来研究统计学中多元回归分析中的变量选取,让大家对统计中 的多元回归数据的选取和操作方法有更深层次的了解。一组数据是对于淘宝交易额的未 来发展趋势的研究,一组数据时对于我国财政收入的研究。本文通过两个实证从不同程 度上对数据选取的研究运用通俗的语言和浅显的描述将SPS

2、S在多元回归分析中的统计 分析方法呈现在大家面前,让大家对多元回归分析以及SPSS软件都可以有更深一步的 了解。通过SPSS软件对数据进行分析,对数据进行处理的方法进行总结,找出SPSS对 于数据处理和分析的优缺点,最后得在对变量的选取和软件的操作提出建议。关键词:统计学 SPSS 变量的选取多元回归分析AbstractIn this paper, not only for complex statistical calculations done by the commonly used computer application software of SPSS, through the e

3、mpirical analysis of the two groups of data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody to select multiple regression in statistical data and operation methods have a deeper understanding. Is a set of data for the future developme

4、nt trend of taobao transactions of research, a set of data for the research of our countrys financial income. In this paper, through two empirical to select data from different extent research using a common language and plain the SPSS statistical analysis method in multiple regression analysis of p

5、resent in front of everyone, let everyone to multiple regression analysis and SPSS software can have a deeper understanding. Through the SPSS software to analyze data, and summarizes method of data processing, find out the advantages and disadvantages of SPSS for data processing and analysis, finall

6、y had to put forward the proposal to the operation of the selection of variables and software.Keywords: Statistical SPSS The selection of variables multiple regression analysis目录摘要1英文摘要1引言3第一章回归分析31.1自变量的选择41.2国内外研究现状5第二章案例分析一:淘宝交易额的研究62.1数据的来源及变量的选取62.2相关分析72.2.1散点图72.2.2计算相关系数82.3回归分析112.4小结13第三章案

7、例分析二:财政收入的研究 143.1数据的来源及变量的选取143.2相关分析153.2.1散点图153.2.2计算相关系数173.3回归分析193.4逐步回归213.5小结24第四章总结及建议 25参考文献26引言统计学是一门提供数据信息的收集、处理、归纳和分析的理论与方法的科学。然而 随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商 管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对 于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活 性也较强,计算量大且复杂。随着我国社会主义市场经济的日趋完善,不管是在宏观经

8、济的经济调控领域还是在微观的企业管理领域中,人们必须准确及时的获得经济运行中 的各类信息才能得到高效的监控和科学的管理。然而科学研究的深入,研究的对象也日 益变得复杂,复杂系统的研究问题更是成为当今研究的热点。为了更好的描述一个复杂 的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会 研究的一项重要课题。基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国 的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年 的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对 淘宝网的未来发展趋势进行定量数据

9、的研究以及案例二对于我国财政收入的研究,通过 对2000年到2012年的人均国内生产总值,经济活动人口,全社会固定投资,进出口总 额,居民消费价格水平对我国财政收入的影响进行定量数据的研究。通过对数据的选取, 以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法。第一章自变量的选择1.1自变量的选择在多元线性回归模型中,自变量的选择实质上就是模型的选择。现设一切可供选择 的变量是t个,它们组成的回归模型称为全模型(记:m = t +1),在获得n组观测数据 后,我们有模型(Y = X P + |s N (0q 21 )其中:Y是n x 1的观测值,p是m x 1未知参数

10、向量,X是n x m结构矩阵,并假定X的 秩为m。现从X , X,,X这t个变量中选t变量,不妨设X , X,,X,那么对全模型中的参1 2t1 2t数P和结构矩阵X可作如下的分块(记:p = t,+1 ):0 =G , 0 ) ,X =(X : X )我们称下面的回归模型为选模型:Y = X 0 + N(0, X 21 )n其中:Y是n x 1的观测值,0 p是px 1未知参数向量,Xp是n x p结构矩阵,并假定X 的秩为p。自变量的选择可以看成是这样的两个问题,一是究竟是用全模型还是用选模型,二 是若用选模型,则究竟应包含多少变量最适合。如果全模型为真,而我们用了选模型, 这就表示在方程

11、中丢掉了部分有用变量,相反,如果选模型为真,而我们选用了全模型, 这就表示在方程中引入了一些无用变量,下面从参数估计和预测两个角度来看一看由于 模型选择不当带来的后果。为了讨论方便起见,先引入几个记号:全模型中参数0 q 2的估计:0 = (X X)-1X YX 2 =1Y fI - X (X X)-1X fYn - R (X)其中:R(X)为矩阵X的秩。在点x =(气X)点上的预测值为七=Xp0p在选模型中参数0,C 2的估计:0 = (X,X )-1 X fYX 2 = 1Y I - X (X X )-1X Yp n - R (X )在X = (X,X,) = (x, x )(x ,X )

12、上的预测值为=X 0p q1 p p+1tp p p1.2国内外研究现状在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发 应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。 今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立, 实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的 成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。在应用回归分析去处理 实际问题时,回归自变量选择是首先要解决的重要问题。通常,在做回归分析时,人们根 据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的

13、的一些因素作为自变量 引进回归模型,其结果是把一些对因变量影响很小的,有些甚至没有影响的自变量也选入 了回归模型中,这样一来,不但计算量变大,而且估计和预测的精度也会下降。此外,如 果遗漏了某些重要变量,回归方程的效果肯定不好。在一些情况下,某些自变量的观测数 据的获得代价昂贵,如果这些自变量本身对因变量的影响很小或根本没有影响,我们不加 选择的引进回归模型,势必造成观测数据收集和模型应用的费用不必要的加大。因此,在 应用回归分析中,对进入模型的自变量作精心的选择是十分必要的。SPSS软件作为当今国际上运用广泛的统计分析软件,因其具有自动统计绘图、数据的深 入分析、易学易用、功能齐全等特点,在

14、各个领域得到了迅速普及,并成为各行业管理组织提 高管理水平、形成科学决策的重要手段。然而,我国对该软件的理解和运用还处于早期应用 阶段,对其功能的研究开发与实际生活当中的运用与西方发达国家相差甚远。特别是在管理 决策方面,管理者对客观现实的准确把握对于决策起着至关重要的作用,他们花费大量人力、 物力、财力收集统计数据,但是由于没有进行深度分析而浪费,或者仅仅利用SPSS软件进行 简单分析而未进行深度开发,致使所得信息有限、各信息间的关系不明确,最终导致管理者的 判断出现偏差。第二章案例分析一:淘宝交易额的研究2.1数据的来源及变量的解释为研究淘宝网未来发展趋势,从新浪官方微博淘宝数据魔方中获得

15、淘宝2009年聚 划算中购物群众的年龄比例作为定性数据,进行研究年龄对淘宝购物的影响。并在新浪 财经网上获得淘宝网自2005年到2012年的淘宝交易额以及淘宝注册人数的数据。在中 商情报局里获得我国近网络普及度等数据并从国家统计年鉴中选取统计指标居民消费 水平。淘宝注册人数(气)在一定程度上反应了网络购物的群众的人数,反应了当今社会 网络购物的普遍性。同时淘宝的注册人数也展现了人们对网络购物的认可度,换言之也 就是说接受了网络购物并会在网上进行消费,是对网络购物很大程度上的支持。我国网络普及度(七)是指我国近几年网络在我国普及的范围,这一块更好的反映 了网络对居民网络消费的影响,因为网络是网络消费的必要条件。我国网络普及度反映 的是在我国日趋发展的经济下,网络也得到了普遍的广泛,人们对网络的接受程度,信 任程度也是直接影响到淘宝的网络购物。居民消费水平(x3)是指居民在物质产品和劳务的消费过程中,对满足人们生存、 发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出 来。居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和 享受需要方面所达到的程度。它主要通过消费的物质产品和劳务的数量和质量来反映。 居民消费水平的提高也能很好的展现在网络消费上作出的贡献。通过对以上这三个定

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号