基于Logistic回归模型的人口预测分析

上传人:aa****6 文档编号:29218111 上传时间:2018-01-22 格式:DOCX 页数:18 大小:408.84KB
返回 下载 相关 举报
基于Logistic回归模型的人口预测分析_第1页
第1页 / 共18页
基于Logistic回归模型的人口预测分析_第2页
第2页 / 共18页
基于Logistic回归模型的人口预测分析_第3页
第3页 / 共18页
基于Logistic回归模型的人口预测分析_第4页
第4页 / 共18页
基于Logistic回归模型的人口预测分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《基于Logistic回归模型的人口预测分析》由会员分享,可在线阅读,更多相关《基于Logistic回归模型的人口预测分析(18页珍藏版)》请在金锄头文库上搜索。

1、- 1 -基于 Logistic 回归模型的人口预测分析尹东旭,李 阳, 马雨晨指导老师:徐 慧(空 军工程大学,西安 XXXXXX)摘 要:本文在数值微分法和最小二乘法曲线拟合的基础上对 Logistic 回归模型进行参数估计,预测了人口城镇化和老龄化两个影响因素以及 2016-2030年我国的人口总数以及人口所能达到的最大值并对其加以检验。关键词:Logistic 回归模型;数值微分;参数估计;曲线拟合;人口预测1 问题重述与社会背景对于中国这样一个人口大国,人口问题始终是制约我们经济、文化等各方面发展的关键因素之一。如何使用数学模型来对我国的人口增长进行准确而有效的预测,关乎我国的人民幸

2、福,更关乎国家的发展大事。近年来中国的人口发展呈现了一些新的特点,比如老龄化进程加速,男女比例失调,以及 农村人口城 镇化,特 别是计划生育政策的施行,这些都不同水平的影响着人口的增长,而 这些因素影响着人口增长趋势预测的准确性。为此,如何综合考量各方面的因素, 较为精确的刻画出人口增 长趋势,是本文的主要目标。 经过分析与讨论后,我们着重探讨了以下问题:1.如何从中国的实际情况和人口增长的特点出发,参考表 1 中的相关数据及其他材料,建立中国人口增长的数学模型;2 如何利用建立的数学模型对中国人口增长做出预测并加以检验。2 基本假设1. 预测时间内没有重大瘟疫、战争、自然灾害等非正常因素影响

3、人口发展。从 图 1中可以看出 2003 年 60 岁以上老人的死亡率因为 SARS 流行达到五年年来最大值,其余年份假设基本保持平稳。 (见图 1)- 2 -2001 2002 2003 2004 200502000400060008000100001200014000死 亡 率 年 龄 段 0-20 死 亡 率 年 龄 段 20-60 死 亡 率 年 龄 段 60+2001-2005年 各 年 龄 段 的 死 亡 率图 1(数据来源于中国统计年鉴)2. 不考虑多胞胎情况。3. 忽略人口统计时漏报误报现象。4. 假设人口只受我国国内的出生率、死亡率和迁移因素影响,不考虑国家之间的移民。3 模

4、型的分析与建立3.1 logistic 模型的介绍Logistic 模型是 1938 年 VerhulstPearl 在修正非密度方程时提出来的,他认为在一定的环境中种群的增长总存在一个上限,当种群的数量逐渐向着上限上升时实际增长率就要逐渐地缩小,所以也被称 为 。广义 Logistic 曲线可以模仿一些方程情况的人口增长(P)的 S 形曲 线。起初阶段大致是 指数增长;然后随着人口开始变得饱和,增加变慢;最后,达到成熟时增加停止,所以又叫 sigmoid 曲线(S 型曲线)。 (摘自百度文库)- 3 -logistic 方程即微分方程:(摘自百度百科)众所周知,人口增长呈现指数型增长,但人口

5、是会受到环境最大容纳量、政策 变化、经济发展、科技进步等的影响,因此这些影响因素都成 为一种阻滞作用,而人口越接近最大值,这种阻滞作用就越大,所以,我们在数值微分和最小二乘法曲线拟合的基础上对 Logistic 数学模型 进行了参数估计,此方法 对许多事物如 经济、生物种群、医疗卫生的发展和预测具有很大的应用价值。只要满足指数增长的事物(S 型曲线),就可以使用这种预测方法。3.2 logistic 模型建立首先,我们不妨设时刻 t 的人口总量为 ,并将 看作 连续、可微的函数。 记初() ()始时刻(t=0)的人口为 。规定人口的增长率为常数 r,即单位时间内 的增量等于 r 乘0 ()以

6、。我们考 虑 t 到 时间内人口的增量, 则有() +(1)( t+t) ()=()令 ,则得到 满足如下的微分方程 0 ()(2)=,(0)=0对人口的阻滞体现在对 r 的影响上,表现为 r 随着人口数量 的增加而下降我 们不妨把人口的增长率 r 表示为 关于人口数量 的函数 ,显而易见 为减函数,于是(2) () ()式可写为(3)=(),(0)=0设 是 的线性函数,即()(4)()=(0,0)此时 r 表示当人口数目比较少时( 理论上设 )的增长率,就是假设此时的人口是=0不受自然资源等限制的固有增长率。我们要明确参数 s 的含义,可以引入最大人口环境容纳量 ,即我国在 现在及未来国情

7、下所能容纳的最大人口数量。则当 时,人口达 =到最大,此时人口增长率为 0,即增长率 从而得到 ,于是 (4)式可()=0 =改写为(5)()=(1)将(5)代入(3)得如下的 模型- 4 -(6)=(1),(0)=0由分离变量法得方程(6)的通解。 =c利用初始条件得。c=00把 c 代入通解并简化得。 (7) x()= 1+(01)(7)式可简 写为 , (8)=1+其中 。=01 , =从(8)式可以看出要想 预测 出人口数量,需求出参数 ,r 或 的值。我们采用 、b求最小二乘法(,)=1( 1+(01)2的最小值,通过求 并令它 们等于零,利用 Matlab 软件进行处理可以估算 r

8、 的值,xm,r xm,并对解取倒数,得到 利用等长度时刻 , , ( =2 )所对应的三1=1+(101)。 0122 1个人口数量求得相关参数,=(10)2(21)0(t= )。=0(1+)(1+01)1-0=2-13.3 Logistic 回归模型的参数估计 对 Logistic 模型 进行参数估计的方法有很多,通常我 们 使用的方法有 Bayes 估计、最小二乘法估计、稳健估计 等等。 这里我们使用数值微分和预测拟合法对 logistic 模型进行参数估计,并对结果进 行合理验证。由解 (8)中可知,只要对参数 , , ,进行估计即可得出结果,主要方法和步 骤如下:(1)首先求 ,对(

9、6)式变形得到- 5 -(9)=设 为年增长率,根据已经得到的人口总量的数据并且利用数值微分的方法计=算得方程的左边就是增长率 ,然后 对 进行线性拟合可以求得 ,由此我们 =+可得 。=|(2)求参数 a、b将(8)式变形为1=(=01,=)两边取对数得 ,令 , , ,就能使复杂ln(1)=ln =ln(1)=ln=的指数形式的解变形为一个线性函数 ,这时 我们可以利用 Matlab2013a 软件=+拟合出 A 与 B 的值,接着就可以求出 的值 ,从而确定出人口模型解的具体=,=形式。3.4 Logistic 模型在人口城镇化以及老龄化中的应用根据国家统计局公布的 1980 年后的人口

10、城乡比以及各年龄段分布,基于上述模型,可以用 Matlab 仿真模拟出未来的变化趋势(见图 2、图 3、图 4)- 6 -图 2 人口城镇化预测从图 2 可以明显看出我国城镇人口比例正在快速增长,说明我国经济正在飞速发展,拟合曲线与散点图拟合程度高,说明预测结果较为准确。- 7 -图 3 农村人口预测从图 3 可以看出,拟合曲线与散点图拟合程度并不高,说明我国农村人口数会随着政策变化、经济发展等不可控因素发生变化,也从 侧面说明人口城镇化正在加速。- 8 -图 4 人口老龄化预测从图 4 可以看出,随着科技的发展,人的寿命越来越长,再加之 优生优育的政策,老龄化也随之加剧,老龄化会影响人口的预

11、测,所以 这是不得不考虑的一个因素。3.5 Logistic 模型在人口预测中的应用 根据中国统计局在统计年鉴中公布的“1949-2008”年人口统计数据(见附录 2),为了得到较为准确有效的数据结果,我们选取了 1980 年到 2005 年的人口数据加以预测。(1980 年以来)年末总人口 出生率 死亡率 自然增长率 年份(万人) () () () 1980 98705 18.21 6.34 11.87 1981 20.91 6.36 14.55 1982 22.28 6.60 15.68 1983 20.19 6.90 13.29 - 9 -1984 19.90 6.82 13.08 19

12、85 21.04 6.78 14.26 1986 22.43 6.86 15.57 1987 23.33 6.72 16.61 1988 22.37 6.64 15.73 1989 21.58 6.54 15.04 1990 21.06 6.67 14.39 1991 19.68 6.70 12.98 1992 18.24 6.64 11.60 1993 18.09 6.64 11.45 1994 17.70 6.49 11.21 1995 17.12 6.57 10.55 1996 16.98 6.56 10.42 1997 16.57 6.51 10.06 1998 15.64 6.50

13、9.14 1999 14.64 6.46 8.18 2000 14.03 6.45 7.58 2001 13.38 6.43 6.95 2002 12.86 6.41 6.45 2003 12.41 6.4 6.01 2004 12.29 6.42 5.87 2005 12.4 6.51 5.89 表 1 1980-2005 年全国历年主要人口数据首先我们可以求出人口年增长率的值,然后再利用 Matlab 软件进行拟合,使用Matlab 软件可以做出数据的散点图(见图 5)我们发现该 曲线为单调函数的图像,并且是呈指数型增长的函数,所以可以选用一次多项式进行拟合并仿真。- 10 -图 5 人口

14、散点图图 6 拟合求最大值由表一中的数据可以拟合出 (单位:亿)(见图 6), , =15.3535 =0.5726,可以得到我国人口 总数的 Logistic 回归模型的表达式为:=0.05073- 11 -=15.35351+0.57260.05073通过 Matlab2013a 进行数据 拟合可以直观且方便地看到人口数 值的变化情况(见图7),从图 中我们 可以发现预测的数据和实际数据曲线拟 合得比较好。图 7 拟合图像与仿真结果于是求出预测中国人口的具体公式= 15.35351+0.57260.05073(0)我们取 1980 年的人口总数为 =9.8705(注:单位:亿) 据上式可以得出 2000

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号