传染病预警

上传人:g**** 文档编号:49132307 上传时间:2018-07-24 格式:PPTX 页数:63 大小:2.40MB
返回 下载 相关 举报
传染病预警_第1页
第1页 / 共63页
传染病预警_第2页
第2页 / 共63页
传染病预警_第3页
第3页 / 共63页
传染病预警_第4页
第4页 / 共63页
传染病预警_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《传染病预警》由会员分享,可在线阅读,更多相关《传染病预警(63页珍藏版)》请在金锄头文库上搜索。

1、传染病预警统计分析模型北京市疾病预防控制中心 杜婧 2015年6月基本概念 监测:连续、系统地收集、分析、解读疾病发生及相关影响因素 的资料,并将其发现用于指导疾病控制实践活动。 预警:在传染病暴发流行事件发生前或发生早期发出信号,以警 示该事件可能发生或其发生的范围、程度等可能扩大 预测:以已有的与传染病流行密切相关的信息为基础,采用一定 的统计模型进行模拟分析,对传染病未来的疫情水平和趋势做出 判断传染病预警模型基于控制图的预警模型基于时间序列理论的预警模型基于回归理论的模时空扫描统计模型贝叶斯时空模型基于控制图的预警模型 控制图法(control charts) 移动平均法(moving

2、 average,MA) 移动百分位数法(movable percentile method,MPM) 累积和控制图(cumulative sums,CUSUM) 指数加权移动平均法(exponentially weighted moving average,EWMA)基于控制图的预警模型控制图法 原理:以历史监测数据为基础,确定监测指标的平均水平与标准 差,按照正态分布的原理,以均数加减若干倍标准差作为控制限 ,监控未来采集的监测指标是否“失控” 优点:简单明了 缺点:不易发现较小的变化均数-标准差图对历史数据具有正态分布假设不易满足基于控制图的预警模型 基于控制图的预警模型移动百分位数法

3、原理:中位数-极差控制图 计算历史基线数据的百分位数: 优点:非参数方法,不需要数据理论的分布假定 缺点:需要一定数量的历史基线数据北京市2015年5月猩红热预警示意图(MPM)基于控制图的预警模型 基于控制图的预警模型 根据其识别异常的灵敏度,美国CDC将Ct分为三类: C1-MILD C2-MEDIUM C3-ULTRA模型评价的统计方法 意义: 比较不同预警算法的差异 探索模型优化,如确定模型参数,确定预警线 探讨可能因素对预警模型的影响,如不同基线数据特征、暴发类 型、暴发强度等 预警模型的评价是通过一系列指标来实现的,最常用的指标是对 暴发事件探测的及时性、灵敏度和特异度模型评价指标

4、 及时性:从事件开始到检测暴发之间的时间长度来衡量 及时性指标:平均暴发探测滞后时间(天) 采用模拟暴发来研究模型的及时性事件开始无法测量事件开始无法测量举例: 采用人工插入暴发作为目标事件,测试MPM法预警效果 探讨的因素:疾病类型、暴发强度和无暴发时疾病基线水平暴发强度甲肝痢疾流行性腮腺炎麻疹疟 疾伤寒猩红热乙脑总计低强度2.11.21.30.71.01.60.20.01.1较低强度2.11.01.30.71.21.40.20.01.1较高强度2.20.81.10.71.01.20.20.01.0高强度2.20.51.20.71.00.90.20.00.9合计2.10.91.20.71.0

5、1.30.20.01.0表:MPM模型:8种疾病不同强度暴发事件的预警平均滞后期(天)模型评价指标 灵敏度:预警模型发现暴发事件的能力; 特异度:预测模型排除非暴发事件的能力; ROC曲线:即受试者工作特征曲线-以灵敏度为纵轴,假阳性率(1-特异度)为横轴绘制; 阳性预测值:模型发出的警报中真流行事件所占的比例; 阴性预测值:模型未发出警报时非流行事件所占的比例;定性资料的ROC分析-SPSS操作例:CUSUM 模型在流行性腮腺炎早期预警中的应用研 究中国卫生统计计2014 年8月第31卷第4期以2011年11月1日2012年12年31日江苏省每日 发病数为实验数据,从2012年1月1日起以C

6、USUM 模 型进行前瞻性试验。最终确定模型参数为h=3,k=0.5基于时间序列理论的预警模型基于时间序列理论的预警模型 时间序列定义:时间序列是指某一个变量在相同时间间隔(年、月、周、日) 上的不同测量值,按时间先后顺序排列而形成的序列。 常用软件:Stata,Matlab,Eviews 和SAS 推荐软件SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块, 编程语言简洁,输出功能强大,分析结果精确时间序列分析平稳时间序列 : ARMA 确定性分析非平稳时间序列 ARIMA随机性分析 残差自回归模型条件异方差模型时间序列预处理 平稳性检验:时序图检验自相关图检验 随机性检验:纯随

7、机性检验平稳时间序列的定义?平稳时间序列的定义? 由于P值显著大于显著性水平0.05,所以该序列不能拒绝纯随机 的原假设. 如果序列平稳白噪声,则无可提取的有用信息 如果序列平稳非白噪声序列,则采用平稳非白噪声序列的建模和 预测方法延迟LB统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454平稳时间序列 AR(P):自回归模型 MA(Q):移动平均模型 ARMA(p,q):自回归移动平均模型ARMA模型的定义 具有如下结构的模型称为自回归移动平均模型,简记为 特别当 时,称为中心化 模型模型识别 样本自相关系数 样本偏自相关系数模型自相关系 数偏自相关 系数 AR(

8、P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾 因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的 完美情况,本应截尾的样本自相关系数或偏自相关系数仍会呈现 出小值振荡的情况 由于平稳时间序列通常都具有短期相关性,随着延迟阶数 样本自相关系数或偏自相关系数都会衰减至零值附近作小值波动平稳时间序列建模步骤平 稳 非 白 噪 声 序 列计 算 样 本 相 关 系 数模型 识别参数 估计模型 检验模 型 优 化序 列 预 测YN非平稳时间序列分析 非平稳数据的分析方法可以分为确定性分析和随机分析两大类 确定性假定序列变化可以由一条趋势线来刻画适用于具有典型趋势特征变化数据的预

9、测常用确定型时间序列模型有指数曲线模型、二次曲线模型等。许多传染病资料并不具有某种典型趋势特征,从而影响预测效 果。此时随机时间序列模型则显示明显优势 随机性分析常用的模型是ARIMA模型ARIMA模型 ARIMA模型适用于各种复杂的时间序列模式,是目前较通用的预 测方法之一,已广泛应用于传染病发病率的预测,特别是具有季 节性趋势的传染病预测。 使用场合 差分平稳序列拟合 模型结构差分运算 一阶差分 阶差分 步差分差分方式的选择 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响 对于蕴含着固定周期的序列进行步长为周期

10、长度的差分运算,通常可以较好地提取周期信息 足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息但过度的差分会造成有用信息的浪费 差分后序列时序图 一阶差分 1阶12步差分ARIMA模型建模步骤获 得 观 察 值 序 列平稳性 检验差分 运算YN白噪声 检验Y 分 析 结 束N拟合 ARIMA 模型乘积ARIMA(p , d , q)(P ,D ,Q)s 模型 有的季节性时间序列不仅含有季节性成分, 还混有非季节性成 分, 若单一用季节性或非季节性ARIMA 模型进行分析, 其预测效 果往往不理想。季节性ARIMA 与非季节性ARIMA 的混合效应 通常表现为相乘的形式 模型完整的结构如

11、下:例:ARIMA乘积季节模型在上海市甲肝发病预测中的应用 资料来源:上海市疾病预防控制中心历史疫情资料,即1990年至 2011年上海市按月报告甲肝病例数作为建模数据,2012年 月发病数作为预测效果评估数据。例:ARIMA乘积季节模型在上海市甲肝发病预测中的应用例:ARIMA乘积季节模型在上海市甲肝发病预测中的应用例:ARIMA乘积季节模型在上海市甲肝发病预测中的应用 预测显示2012年月的发病数低于既往 历史发病水平,而2012年月实际发病数未 出现明显季节高峰。 ARIMA模型应用于短期预测的效果较好, 利用和及时补充新的数据进行模型的再次拟 合,可满足传染病疫情预测和预警的需要。SA

12、S 操作练习数据: 19902014年甲肝发病数(分月)可以使用19902008年数据作为训练集时空扫描统计模型时空扫描统计模型 在监测的区域内,有时尽管出现了局部传染病暴发,如果局部暴发的病例数没有使整个区域病例数显著增加时,时间模型将难以发现这种暴发疫情。 空间数据的统计分析是现代统计学发展迅速的一个分支领域,基于时空维度的预警模型得益于空间统计学的发展,用于揭示监测指标的空间特征,特别是早期发现传染病在地理空间上的聚集性,据此发出预警信号。时空扫描统计模型时空扫描统计模型 时空扫描统计模型 统计假设的原假设为:病例在时间和空间上的分布是完全随机的;备择假设为:与扫描窗口外比,扫描窗口内的

13、发病水平高; 优点:综合考虑了时间和空间信息;扫描窗口动态变化,避免了选择偏移;不需要人口数据;不仅能定性判定是否存在聚集,还能定量判定聚集程度; 局限:基于各子区域内人口增长速度一致的前提假设;扫描半径及扫描时间长度设置缺乏客观标准;时空扫描统计在探测不规则形状的聚集,如沿河流域的集聚方面,存在局限性;时空扫描统计模型 SaTScan v9.4.1 http:/www.satscan.org/download.html软件主界面例:离散泊松时空模型:在新墨西哥州脑肿瘤发病率 病例文件: nm.cas 格式: 人口文件: nm.pop 格式: 坐标文件: nm.geo 格式: 研究时间: 19

14、73-1991 集合: 32 counties 病例时间精度: Years 坐标系: Cartesian 变量 #1, 年龄分组: 1 = 0-4 years, 2 = 5-9 years, . 18 = 85+ years 变量 #2, 性别: 1 = male, 2 = female 人口统计年: 1973, 1982, 1991 数据资源: New Mexico SEER Tumor Registry新墨西哥监测,流行病学和最终结果肿瘤登记处输入界面分析界面输出界面输出结果基于回归理论的模型 1.一元线性回归 2.二次指数回归 3.自回归(时间序列) 4.多元线性回归 5. Serfling回归(周期性回归) 6. Poisson回归 7. 负二项回归软件介绍 SAS9.2 SaTScan9.4 arcgis10.2.2 SPSS Clemetine 12.0谢谢!谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号