基于回归分析的人口预测讲解

上传人:最**** 文档编号:114743557 上传时间:2019-11-12 格式:DOC 页数:20 大小:459KB
返回 下载 相关 举报
基于回归分析的人口预测讲解_第1页
第1页 / 共20页
基于回归分析的人口预测讲解_第2页
第2页 / 共20页
基于回归分析的人口预测讲解_第3页
第3页 / 共20页
基于回归分析的人口预测讲解_第4页
第4页 / 共20页
基于回归分析的人口预测讲解_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《基于回归分析的人口预测讲解》由会员分享,可在线阅读,更多相关《基于回归分析的人口预测讲解(20页珍藏版)》请在金锄头文库上搜索。

1、统计系课程实验论文基于回归分析的人口数量预测 学 号:2014962005姓 名:李洋年 级:2014级专 业:统计学课 程:回归分析指导教师:姜喜春完成日期:2016年6月19日目 录摘 要I前 言1第1章 一元线性回归21.1 指标的选择21.2 样本确定21.3 一元回归分析31.3.1 绘制总人口与粮食产量的散点图31.3.2 设定理论模型41.3.3 回归诊断4第2章 多元线性回归52.1 数据中心化标准化52.2 多元回归模型建立52.3 逐步回归法62.4 多重共线性72.3.1 多重共线性检测82.4 主成分分析92.4.1 主成分分析模型建立9第3章 非线性模型113.1 曲

2、线回归113.1.1 曲线拟合113.2 Logistic模型13结 论15参考文献16理学院 统计系 课程实验论文摘 要回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。同时依据事物发展变化的因果关系来预测事物未来的发展走势,它是研究变量间相互关系的一种定量预测方法,又称回归模型预测法或因果法,应用于经济预测、科技预测和企业人力资源的预测等。回归分析可以说是统计学中内容最丰富、应用最广泛的分支。这一点几乎不带夸张。包括最简单的t检验、方差分析也都可以归到线性回归的类别。而卡方检验也完全可以用logistic回归代替。众多回归的

3、名称张口即来的就有一大片,线性回归、logistic回归、cox回归、poission回归、probit回归等等。关键词:线性回归;非线性回归;logistic回归I前 言最早的形式回归的方法是最小二乘法 ,这是在1805年出版的勒让德 ,和高斯在1809年。 勒让德和高斯都采用的方法确定的问题,从天文观测,有关Sun的机构(主要是彗星,但后来也新发现的小行星)的轨道。 1821年,高斯发表最小二乘法理论的进一步发展,在包括高斯-马尔可夫定理的一个版本。弗朗西斯高尔顿在十九世纪的“回归”是杜撰来描述一种生物现象。 这种现象是高度高大的祖先的后代往往倒退下来,对一个正常的平均水平(这种现象也被称

4、为向均值回归 )。 对高尔顿,回归只有这个生物意义,Udny圣诞节和皮尔逊但他的工作,后来扩展到更一般的统计范围内。 在圣诞节和Pearson,工作的响应和解释变量的联合分布被假定为高斯 。 这个假设RA费舍尔在1922年和1925年,他的作品被削弱。费舍尔认为的响应变量的条件分布为高斯分布,但联合分布不一定要。在这方面,费舍尔的假设是高斯1821年制定的。在20世纪50年代和20世纪60年代,经济学家旧机电台计算器,计算回归。 1970年以前,有时长达24小时接收从一个回归的结果。 回归方法继续是一个活跃的研究领域。 在最近的几十年中,新的方法已经制定了稳健回归 ,回归涉及的相关反应,如时间

5、序列 曲线和增长曲线 ,回归的预测或响应变量的曲线,图片,图表或其他复杂的数据对象,容纳不同的回归方法丢失的数据, 非参数回归 , 贝叶斯方法进行回归,回归的预测变量的测量误差,预测变量的观测回归,回归和因果关系的推论与类型。第1章 一元线性回归 1.1 指标的选择影响人口增长的主要因素经济因素,经济因素对人口自然增长的作用主要表现在它决定了人口的增殖条件和生存条件,通过改变人口的出生率和死亡率来影响人口的自然增率。一般情况下,当人口数量不能满足经济发展对劳动力的需求时,人口自身的再生产必将会刺激;当人口数量超越了经济发展所能提供的消费总数后,人口自身的再生产必将受到遏制。在现代生产力水平下,

6、人口的自然增长率往往随着经济水平的提高而下降。经济因素对人口机械增长也有重要影响。通常情况下,经济发达或发展速度较快的地区,对人口具有一种吸引力和凝聚力,人口机械增长为正值;相反,经济落后或经济发展速度缓慢的地区,对人口会产生一种排斥力和离散力,人口机械增长一般为负值。与此同时粮食产量、出生率、死亡率,也是影响人口增长的因素。符号说明:用、表示粮食产量、GDP、出生率、死亡率。表示总人口。1.2 样本确定通过查阅中国政府网,得到了1980年到2014年各因素的数据。表1-1 样本数据年份粮食产量(万吨)GDP(亿元)出生率(%)死亡率(%)总人口(万人)201460702.61635910.2

7、12.377.16136782201360193.84588018.812.087.16136072201258957.9753412312.17.15135404201157120.85484123.511.937.14134735201054647.7140890311.97.11134091200953082.08345629.211.957.08133450200852870.92316751.712.147.06132802200750160.28268019.412.16.93132129200649804.23217656.612.096.81131448200548402.19

8、185895.812.46.51130756200446946.95160714.412.296.42129988200343069.53136564.612.416.4129227200245705.7512100212.866.41128453200145263.67110270.413.386.43127627200046217.5299776.314.036.45126743199950838.5890187.714.646.46125786199851229.5384883.715.646.5124761199749417.179429.516.576.511236261996504

9、53.571572.316.986.56122389199546661.861129.817.126.57121121199444510.148459.617.76.49119850199345648.835524.318.096.64118517199244265.827068.318.246.64117171199143529.321895.519.686.7115823199044624.318774.321.066.67114333198940754.917090.321.586.54112704198839408.115101.122.376.64111026198740297.71

10、2102.223.336.72109300198639151.210308.822.436.86107507198537910.89039.921.046.78105851198440730.57226.319.96.82104357198338727.55975.620.196.9103008198235450533322.286.61016541981325024898.120.916.36100072198032055.54551.618.216.34987051.3 一元回归分析定义1.1 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的

11、一种统计分析方法。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。1.3.1 绘制总人口与粮食产量的散点图图1-1 粮食产量与总人口散点图1.3.2 设定理论模型根据图1-1随着粮食产量的增加,总人口的数量增加,且各样本点大致落在一条直线附近,故可以采用公式: (1-1)一元线性回归理论模型,对数据进行一元回归分析。1.3.3 回归诊断表1-1 模型摘要模型RR 平方調整後 R 平方標準偏斜度錯誤1.909a.826.8214985.99669a. 預測值:(常數),粮食产量(万吨)根据表1-1模型摘要表可以看到,说明以粮食产

12、量为唯一因变量与总人口的拟合程度很高。表1-2 系数模型非標準化係數標準化係數T顯著性B標準錯誤Beta1(常數)53054.4045500.0139.646.000粮食产量(万吨)1.468.117.90912.513.000a. 應變數: 人口(万人)根据表1-2系数表,将系数带入公式(1-1)可得出回归模型公式:用一元回归模型对2014年的总人口进行预测,的到的预测值第2章 多元线性回归定义2.1 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合

13、实际。2.1 数据中心化标准化数据中心化和标准化在回归分析中的意义是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。图2-1 标准化结果2.2 多元回归模型建立多元回归模型公式:对数据进行多元回归分析,结果如图2.2表2-1 模型摘要模型RR 平方調整後 R 平方標準偏斜度錯誤1.972a.944.9362967.56830a. 預測值:(常數),死亡率(%), 出生率(%), 粮食产量(万吨), GDP(亿元)表2-2 變異數分析a模型平方和df平均值平方F顯著性1迴歸4448849243.98441112212310.996126.295.000b殘差264193847.616308806461.587總計4713043091.60034a. 應變數: 人口(万人)b. 預測值:(常數),死亡率(%), 出生率(%), 粮食产量(万吨), GDP(亿元)表2-3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号