医药信息分析与决策回归分析

上传人:san****019 文档编号:83475961 上传时间:2019-02-27 格式:PPT 页数:53 大小:654KB
返回 下载 相关 举报
医药信息分析与决策回归分析_第1页
第1页 / 共53页
医药信息分析与决策回归分析_第2页
第2页 / 共53页
医药信息分析与决策回归分析_第3页
第3页 / 共53页
医药信息分析与决策回归分析_第4页
第4页 / 共53页
医药信息分析与决策回归分析_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《医药信息分析与决策回归分析》由会员分享,可在线阅读,更多相关《医药信息分析与决策回归分析(53页珍藏版)》请在金锄头文库上搜索。

1、医药信息分析与决策,第二章 回归分析,本章要点,一、概述 二、回归分析 三、时间序列分析 四、Microsoft SQL Server 2005实践回归分析与时间序列分析,2,22:30:44,一、概 述,现实生活中的许多现象之间存在着相互依赖、相互制约的关系,这些关系在量上主要有两种类型: 确定性关系 非确定性关系,3,22:30:44,一、概 述,回归分析与时间序列分析 回归分析的过程即是寻求有关联(相关)的变量之间的关系的过程;利用求得的关系式进行预测和控制。 时间序列分析的基本思想是根据系统的有限长度的运行记录,建立能比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借此对系统

2、的未来行为进行预测。 二者建模思路不同。,4,22:30:44,二、回归分析,5,体重与肺活量之间有何关系,这里面的人都正常吗?如何处理?,22:30:44,回归分析,6,22:30:44,回归分析,7,22:30:44,二、回归分析 散点图,8,22:30:44,二、回归分析 一元线性回归,9,22:30:44,二、回归分析 最小二乘法,10,最小二乘法,22:30:44,二、回归分析 最小二乘法,最小二乘法:拟合回归模型的原则是寻求代表性最好的模型 是一个随机变量; 的均值为零,即 ; 在每一个时期中, 的方差为常量,即 各个 相互独立; 与自变量无关。,11,22:30:44,二、回归分

3、析 最小二乘法,最小二乘法,12,22:30:44,二、回归分析 最小二乘法,利用EXCEL计算:单击菜单栏中“工具” “加载宏”命令,选择相应的“分析工具库”和“分析工具库VBA函数”复选框,单击“确定”按钮,完成加载。,13,22:30:44,二、回归分析 最小二乘法,利用EXCEL计算:单击“工具”“数据分析”命令,选中“回归”选项,单击“确定”按钮。,14,Y=760.25+60.18x,22:30:44,15,22:30:44,二、回归分析 假设检验,对回归方程进行假设检验:通常包括如下三个方面 回归系数显著性检验 回归模型的显著性检验 检验 之间是否存在自相关关系,16,22:30

4、:44,二、回归分析 假设检验,回归系数显著性检验 检验假设: 检验统计量: 检验规则:给定显著性水平,若 ,则回归系数显著。,17,22:30:44,二、回归分析 假设检验,回归模型的显著性检验 检验假设: 回归方程不显著 回归方程显著 检验统计量: 检验规则:给定显著性水平 ,若 ,则回归系数显著。,18,22:30:44,二、回归分析 假设检验,检验 之间是否存在自相关关系 当 时,如果 ,认为存在正自相关;如果 ,认为 无自相关; 当 时, 如果 ,认为 存在负自相关;如果 ,认为无自相关;如果 ,不能确定 是否自相关; 当D.W.值在2左右时,模型不存在一阶自相关。,19,22:30

5、:44,二、回归分析 多元回归分析,多元回归分析,22:30:44,20,二、回归分析 非线性回归分析,非线性回归分析,22:30:44,21,三、时间序列分析,Time Series A time series is a sequence of data values for a variable Y1,Y2,Yn that are separated by equal time intervals. Yt is the notation for the value of time series at time t. 回归分析中,如果自变量是时间变量,则将按时间顺序产生和排列的离散型观测数据

6、序列( )(t1,2,T)称作时间序列,t通常用年、月、季或天来计量。根据时间序列,揭示相应系统的内在统计特性和发展规律的统计方法,就称时间序列分析。,22:30:44,22,三、时间序列分析,Example: Number of people employed at International Systems Corporation for 20 quarters.,22:30:44,23,三、时间序列分析,Example: the following data indicate the number of mergers that took place in an industry ove

7、r a 19-year period.,22:30:44,24,三、时间序列分析,Example: Number of people employed at International Systems Corporation for 20 quarters.,22:30:44,25,三、时间序列分析,Example: the following data indicate the number of mergers that took place in an industry over a 19-year period.,22:30:44,26,时间序列分析,22:30:44,27,三、时间序

8、列分析,Four Components of Time Series 1. Trends 长期趋势 2. Seasonal variations 季节变化 Cyclical variations 周期变化 Irregular variations 不规则变化,22:30:44,28,三、时间序列分析,Four Components of Time Series Trends (长期趋势):Trends in time series are the long-term movements of the series that can be characterized by steady or o

9、nly slightly variable rates of change.,22:30:44,29,三、时间序列分析,Four Components of Time Series Seasonal variations(季节变):Seasonal variations in a time series are those variations that occur rather predictably at a particular time each year.,22:30:44,30,三、时间序列分析,Four Components of Time Series Cyclical var

10、iations(周期变化):Cyclical variations are movements in a time series that are recurrent but that occur in cycles of longer than a year.,22:30:44,31,三、时间序列分析,Four Components of Time Series Irregular variations(不规则变化):Irregular variations constitute the class of time series movements that do not fit into

11、the other three categories.,22:30:44,32,三、时间序列分析,Classical Time Series Model (1)Multiplicative Time Series Model YTSCI (2)Additive Time Series Model YTSCI (3)Mixed Time Series Model YTSCI,22:30:44,33,1. 趋势外推法,趋势外推法(Trend extrapolation)是根据过去和现在的发展趋势推断未来的一类方法的总称。 基本原理是回归分析,即以时间为自变量,以时间系列为因变量进行回归分析。,22

12、:30:44,34,2. 移动平均法,对于平稳型时间数列可取最近n期数值的算术平均作为后期的预测值。其基本原理是:首先选择一个固定的时间周期n,将最近n期的数据加以平均作为下一期的预测值。,22:30:44,35,2. 移动平均法,移动平均方法具有以下的特点: 1.当时间序列的波动较大时,最近期的观察值应该赋予最大的权数,较远时期的观察值赋予的权数应该依次递减;当时间序列的波动不是很大时,对各期的观察值应赋予近似相等的权数。 只使用最近期的数据,在每次计算移动平均值时,移动的间隔都为固定的k; 2 .主要适合对较为平稳的时间序列进行预测; 3. 移动间隔和权数的选择是该方法的关键。,22:30

13、:44,36,3.指数平滑法,它是加权平均的一种特殊形式,观察值距离预测时期越久远,权数变得越小,且呈现指数下降趋势,因此称为指数平滑。指数平滑法根据平滑的次数包括一次指数平滑、二次指数平滑、三次指数平滑等. 用的最多的是一次平滑法,下面对一次平滑进行介绍。,22:30:44,37,3.指数平滑法,指数平滑法具有以下的特点: 不同的会对预测结果产生不同的影响,阻尼系数也是如此; 在实际应用中,当时间序列有较大的随机波动时,宜选用较大的值 (如0.9),以便能很快跟上近期的变化; 当时间序列比较平稳时,宜选用较小的 ; 选择平滑系数时,还应考虑预测误差。确定时,可尝试选择几个进行预测,然后找出预

14、测误差最小的那个作为最后的值。,22:30:44,38,例:某市某一恶性疾病死亡率统计数据表,22:30:44,39,某市某一恶性疾病死亡率,22:30:44,40,3.指数平滑法,据此预测2008年该病的死亡率,以便做出相应的预防措施。,22:30:44,41,4.随机时间序列分析,随机时间序列分析是指仅用它的过去值及随机扰动项所建立起来的模型进行分析,即描述序列xt某一时刻t和前p个时刻序列值之间的相互关系的分析方法,一般的p阶自回归过程AR(p)为:,22:30:44,42,4.随机时间序列分析,建立具体的时间序列模型时,需解决如下三个问题: 1) 模型的具体形式。 2) 时序变量的滞后

15、期。 3) 随机扰动项的结构。 例如,取线性方程、一期滞后以及白噪声随机扰动项,模型将是一个1阶自回归过程:,22:30:44,43,4.随机时间序列分析,22:30:44,44,四、Microsoft SQL Server 2005实践回归分析与时间序列分析,1.建立数据库 2.导入数据 3.建立数据挖掘模型 4.数据挖掘查看器,45,22:30:44,北京市SARS传播部分统计数据表,数据源视图设计器,创建用于SARS线性回归的挖掘结构并部署项目和处理挖掘模型,创建用于SARS时序分析的挖掘结构并部署项目和处理挖掘模型,回归模型解释,挖掘图例窗口中的直方图对应于相关性系数。直方图的长度表示

16、相关性的大小;直方图的方向表示相关性的性质:方向向右表示正相关,方向向左表示负相关。,时序模型解释,下图显示了“治愈出院累计”时序的8阶自回归模型,可以利用该回归模型对“治愈出院累计”进行预测,其中“治愈出院累计(-1)”表示预测时间前一天的数据。可以看出,该时间序列与前1天、前4天和前7天正相关,与其余5天负相关,且与前1天的“治愈出院累计”相关性最大。,图表解释,可以看出,“治愈出院累计”随着时间的推移而增加,根据增加的速度可以将“治愈出院累计”时间序列分为三个阶段:第一个阶段是缓慢增加,这是因为SARS刚出现时治疗经验不足,并且确诊病人不多;第二个阶段是较快增加,主要原因是治疗经验增加,导致确诊病人和治愈病人的速度加快;第三个阶段是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号