《传染病监测数据时空分析及早期预警统计技术研究进展----湖南卫生监督网》由会员分享,可在线阅读,更多相关《传染病监测数据时空分析及早期预警统计技术研究进展----湖南卫生监督网(117页珍藏版)》请在金锄头文库上搜索。
1、传染病监测数据传染病监测数据时空分析及早期预警的统计技术研究进展时空分析及早期预警的统计技术研究进展 四川大学华西公共卫生学院四川大学华西公共卫生学院四川大学华西公共卫生学院四川大学华西公共卫生学院卫生统计学教授卫生统计学教授卫生统计学教授卫生统计学教授李晓松李晓松李晓松李晓松20092009年年年年9 9月月月月2626日日日日 昆明昆明昆明昆明Company Logo随随随随着着着着信信信信息息息息技技技技术术术术的的的的迅迅迅迅速速速速发发发发展展展展,已已已已经经经经和和和和正正正正在在在在产产产产生生生生大大大大量量量量各类公共卫生信息和数据。各类公共卫生信息和数据。各类公共卫生信息
2、和数据。各类公共卫生信息和数据。数数数数据据据据分分分分析析析析理理理理论论论论的的的的滞滞滞滞后后后后和和和和分分分分析析析析技技技技术术术术的的的的缺缺缺缺失失失失,数数数数据据据据所所所所隐隐隐隐含含含含的的的的知知知知识识识识并并并并未未未未被被被被充充充充分分分分认认认认识识识识和和和和利利利利用用用用,而而而而这这这这些些些些知知知知识识识识可能具有潜在的巨大应用价值。可能具有潜在的巨大应用价值。可能具有潜在的巨大应用价值。可能具有潜在的巨大应用价值。Company Logov3S3S技技技技术术术术等等等等先先先先进进进进技技技技术术术术的的的的迅迅迅迅速速速速发发发发展展展展和
3、和和和应应应应用用用用,为为为为深深深深入入入入分分分分析析析析和和和和揭揭揭揭示示示示公公公公共共共共卫卫卫卫生生生生信信信信息息息息数数数数据据据据间间间间复复复复杂杂杂杂的的的的时时时时间间间间和和和和空空空空间间间间关关关关系系系系,一一一一方方方方面面面面提提提提供供供供了了了了重重重重要要要要的的的的基基基基础础础础技技技技术平台,另一方面又产生了新的数据源。术平台,另一方面又产生了新的数据源。术平台,另一方面又产生了新的数据源。术平台,另一方面又产生了新的数据源。Company Logo时空分析及早期预警统计技术研究进展时空分析及早期预警统计技术研究进展时空分析及早期预警统计技术
4、研究进展时空分析及早期预警统计技术研究进展vv贝叶斯时空分析技术贝叶斯时空分析技术贝叶斯时空分析技术贝叶斯时空分析技术(Bayesian Disease Mapping)(Bayesian Disease Mapping)vv多源监测数据分析技术多源监测数据分析技术多源监测数据分析技术多源监测数据分析技术(Multivariate Surveillance Data (Multivariate Surveillance Data Analysis) Analysis) 贝叶斯网络和隐马尔科夫模型贝叶斯网络和隐马尔科夫模型贝叶斯网络和隐马尔科夫模型贝叶斯网络和隐马尔科夫模型vv聚集性探测聚集性探
5、测聚集性探测聚集性探测(Cluster Detection)(Cluster Detection)vvCompany Logo贝叶斯时空分析技术贝叶斯时空分析技术Bayesian Disease MappingCompany Logo多维度多维度多尺度多尺度多层次多层次三个基本特征传染病数据基本要素和特征 传染病数据是传染病流行过程及其相关因素关系的符号化表示。时态时态位置位置属性属性三个基本要素 人们所观察到的传染病流行是一系列复杂的自然与社会因素综合作用的结果。所谓传染病“流行规律”可理解为在自然与社会多源复杂因子作用在自然与社会多源复杂因子作用下传染病流行的时空变化及其下传染病流行的时空
6、变化及其相关因素的时空共变轨迹。相关因素的时空共变轨迹。贝叶斯时空分析技术贝叶斯时空分析技术 从从时时间间轴轴看看,在在揭揭示示传传染染病病发发病病( (率率) )随随时时间间发发生生变变化化的的同同时,揭示其在每个时点上发病时,揭示其在每个时点上发病( (率率) )存在的空间变异;存在的空间变异; 从从空空间间轴轴看看,在在揭揭示示传传染染病病发发病病( (率率) )随随区区域域不不同同而而发发生生变变化化的的同同时时,揭揭示示在在这这些些异异质质的的区区域域上上发发病病( (率率) )存存在在的的时时间间变异。变异。 与与此此同同时时,还还指指揭揭示示与与传传染染病病发发病病( (率率)
7、)上上述述时时空空变变异异所所关关联的各种因子及其变化。联的各种因子及其变化。vBayes学学说说是是不不同同于于经经典典统统计计(频频率率学学派派)的的另另一一大大统统计计学学派派,随随着着计计算算机机技技术术 的的 发发 展展 和和 Markov Chain Monte Carlo (MCMC)抽抽 样样 算算 法法 的的 引引 入入 ,Bayes方法得以迅速发展和广泛应用。方法得以迅速发展和广泛应用。Company LogoBayesian Disease Mapping的优势的优势v可可可可利利利利用用用用人人人人们们们们对对对对于于于于传传传传染染染染病病病病流流流流行行行行及及及及
8、其其其其相相相相关关关关因因因因素素素素的的的的先先先先验知识确定先验分布。验知识确定先验分布。验知识确定先验分布。验知识确定先验分布。v由由由由于于于于传传传传播播播播特特特特性性性性,传传传传染染染染病病病病流流流流行行行行常常常常呈呈呈呈现现现现出出出出时时时时空空空空相相相相关关关关性,性,性,性,BayesBayes建模可借用邻近时空信息。建模可借用邻近时空信息。建模可借用邻近时空信息。建模可借用邻近时空信息。Company Logo自然环境数据自然环境数据传染病时空数据传染病时空数据时空建模平台时空建模平台基于基于基于基于BayesBayes框架时空建模框架时空建模框架时空建模框架
9、时空建模的传染病流行规律多维度分析的传染病流行规律多维度分析的传染病流行规律多维度分析的传染病流行规律多维度分析GISRS信息信息系统系统基于基于Bayes框架建模充分反映了传染病数据的框架建模充分反映了传染病数据的基本要素与特征基本要素与特征 Company Logo多维度多维度属性维属性维时间维时间维空间维空间维多维度、多尺度和多层次病例的基本人口学特征以及与病例的基本人口学特征以及与病例的基本人口学特征以及与病例的基本人口学特征以及与流行相关的主要自然流行相关的主要自然流行相关的主要自然流行相关的主要自然/ /社会因素社会因素社会因素社会因素 随时间推移,各区域疟疾发病相对危险度连续发生
10、变化 各区域间相对危险度存在差异(空间异质性) 相邻区域相对危险度有相似性(空间相关性) 降雨量与疟疾发病的数量关系(系数)随不同时期发生变化亚马逊河区域某州某时期亚马逊河区域某州某时期疟疾疟疾发病的相对危险度变化发病的相对危险度变化 96.1 96.12 97.12 98.12 时间系数Aline A. Nobre, Alexandra M. Schmidt, Hedibert F. Lopes. Spatio-temporal models for mapping the incidence of malaria in Par. Environmetrics, 2005, 16: 291
11、304.v发病发病( (率率) )在在各个区域的时间变异各个区域的时间变异: :v各时点各时点( (段段) )的空间变异。的空间变异。v相关因素与发病相关因素与发病( (率率) )的影响、以及这种影响的影响、以及这种影响在不同时间的变化和不同空间的变化。在不同时间的变化和不同空间的变化。发病(率)的空间相关性与异质性大小及其在时间上的变异。Company Logo多尺度多尺度多尺度多尺度:传染病流行在不同时空尺度上表现出:传染病流行在不同时空尺度上表现出:传染病流行在不同时空尺度上表现出:传染病流行在不同时空尺度上表现出的特征可能不同。的特征可能不同。的特征可能不同。的特征可能不同。传染病时空
12、信息在概化和细化过程中传染病时空信息在概化和细化过程中传染病时空信息在概化和细化过程中传染病时空信息在概化和细化过程中反映出的特征渐变规律反映出的特征渐变规律反映出的特征渐变规律反映出的特征渐变规律探索不同时空尺度间信息转换探索不同时空尺度间信息转换探索不同时空尺度间信息转换探索不同时空尺度间信息转换及不同尺度的效应及不同尺度的效应及不同尺度的效应及不同尺度的效应Company Logo在全球尺度,可发现登革热广泛流行于北纬30 度和南纬20度之间。非洲、东南亚、西太平洋地区地区、美洲加勒比地区及欧洲部分境域Company Logo近10年其分布有向高纬度或高海拔地区扩散趋势Company L
13、ogoCompany LogoCompany Logo但如在地区尺度上如我国海南地区,它可能呈散在聚集分布而未能呈现出任何规律。Company LogoCompany Logo多层次多层次国家省地市区县乡镇街道个体Company Logo 个体本身特征 + 所在环境特征个体是否发生传染病Company Logo个个个个体体体体( ( ( (个个个个案案案案数数数数据据据据) ) ) )和和和和环环环环境境境境( ( ( (集集集集合合合合数数数数据据据据) ) ) )因因因因素素素素的的的的独独独独立和联合效应立和联合效应立和联合效应立和联合效应各各各各层层层层次次次次因因因因素素素素对对对对
14、传传传传染染染染病病病病发发发发病病病病( ( ( (率率率率) ) ) )的的的的影影影影响响响响以以以以及及及及对对对对传染病发病传染病发病传染病发病传染病发病( ( ( (率率率率) ) ) )在不同层次之间变异的影响在不同层次之间变异的影响在不同层次之间变异的影响在不同层次之间变异的影响时空模型时空模型多水平模型多水平模型多水平模型多水平模型Company Logo聚集性探测聚集性探测Cluster DetectionCompany Logo回顾性和前瞻性两种分析策略回顾性和前瞻性两种分析策略v 回顾性分析:发病模式与病因探索回顾性分析:发病模式与病因探索回顾性分析:发病模式与病因探索
15、回顾性分析:发病模式与病因探索v 前瞻性分析:实时监测与早期预警前瞻性分析:实时监测与早期预警前瞻性分析:实时监测与早期预警前瞻性分析:实时监测与早期预警Company LogoKullduff前瞻性时前瞻性时-空扫描统计量空扫描统计量Rogerson空间模式监测方法空间模式监测方法前瞻性聚集性探测方法前瞻性聚集性探测方法 目目目目前前前前我我我我国国国国部部部部分分分分地地地地区区区区用用用用于于于于预预预预警警警警的的的的方方方方法法法法主主主主要要要要是是是是单单单单纯纯纯纯时间聚集性探测方法。时间聚集性探测方法。时间聚集性探测方法。时间聚集性探测方法。 其其主主要要目目的的是是探探测测
16、时时间间序序列列数数据据中中发病例数异常增加的时点。发病例数异常增加的时点。 Company Logo单纯时间聚集性分析的单纯时间聚集性分析的主要不足:主要不足: 未未利利用用疫疫情情数数据据中中的的空空间间信信息,难以及时、准确地预警。息,难以及时、准确地预警。国国外外的的研研究究多多开开始始于于2001年年炭炭疽疽恐恐怖怖事事件件后后,纽纽约约、华华盛盛顿顿、西西雅雅图图等等地地先先后后建建立立了了早早期期预预警警系系统统试试点点 (时时-空空扫扫描描统统计计量量和和贝叶斯网络等技术贝叶斯网络等技术)。国内外预警系统研究的区别国内外预警系统研究的区别探测方法监测系统国内 单纯时间聚集性探测
17、传统监测国外时空聚集性探测症状监测国内外预警系统研究的区别国内外预警系统研究的区别探测方法监测系统国内 单纯时间聚集性探测传统监测国外时空聚集性探测症状监测前瞻性时空扫描统计量前瞻性时空扫描统计量Company Logo研究区域扫描窗口病例寻找病例最多的窗口: 扫描统计量Sv由于传染病的特殊性,用于传染病监测的由于传染病的特殊性,用于传染病监测的扫描统计量,其构建更为复杂。扫描统计量,其构建更为复杂。 Company Logo传染病时空聚集性的特点传染病时空聚集性的特点无法预知传染病爆发可能的规模扫描窗口的大小应当是动态变化的扫描窗口的大小应当是动态变化的 传染病时空聚集性的特点某些因素造成传
18、染病发生数在时间和空间的自然变异:如季节性应当对这些因素进行校正应当对这些因素进行校正 传染病时空聚集性的特点人口的地理分布不均匀如:城市人口密度高于农村应对人口密度的不均匀进行校正应对人口密度的不均匀进行校正 寻找病例最多的窗口:寻找病例最多的窗口: 扫描统计量扫描统计量S如何得到如何得到P 值值寻找扫描统计量的概率分布?寻找扫描统计量的概率分布?非常复杂和困难的概率理论问题非常复杂和困难的概率理论问题新近发展的新近发展的KullduffKullduff时空扫描统计量时空扫描统计量扫描窗口大小可变扫描窗口大小可变扫描窗口大小可变扫描窗口大小可变对非均匀的人口密度进行校正对非均匀的人口密度进行
19、校正对非均匀的人口密度进行校正对非均匀的人口密度进行校正 采采采采用用用用蒙蒙蒙蒙特特特特卡卡卡卡罗罗罗罗随随随随机机机机化化化化法法法法进进进进行行行行假假假假设设设设检检检检验验验验,无无无无需需需需再再再再考虑扫描统计量的概率分布考虑扫描统计量的概率分布考虑扫描统计量的概率分布考虑扫描统计量的概率分布 Company Logo扫描窗口:一定地理区域扫描窗口:一定地理区域空间扫描统计量扫描窗口:一定时间长度时间扫描统计量时空扫描统计量一定的时间长度一定的时间长度一定的时间长度一定的时间长度一定的地理区域一定的地理区域一定的地理区域一定的地理区域传染病早期预警系统传染病早期预警系统与可视化平
20、台与可视化平台Company Logo数据库数据库网络直报系统网络直报系统早期预警系统框架早期预警系统框架数据获取数据库数据库探测算法探测算法采用聚集性探测算法进行数据分析网络直报系统网络直报系统早期预警系统框架早期预警系统框架数据库数据库数据库数据库探测算法探测算法探测算法探测算法地理信息系统地理信息系统地理信息系统地理信息系统地理编码地理编码 &可视化实现可视化实现网络直报系统网络直报系统网络直报系统网络直报系统早期预警系统框架早期预警系统框架早期预警系统框架早期预警系统框架数据库数据库探测算法探测算法探测算法探测算法地理信息系统地理信息系统报告报告早期预警系统框架早期预警系统框架网络直报
21、系统网络直报系统Google Earth 可视化平台可视化平台aGEGE支支支支持持持持的的的的图图图图形形形形为为为为三三三三维维维维图图图图形形形形,较较较较二二二二维维维维图图图图形形形形直直直直观观观观,且可任意改变方位和视角进行查看。且可任意改变方位和视角进行查看。且可任意改变方位和视角进行查看。且可任意改变方位和视角进行查看。 aGEGE提提提提供供供供的的的的卫卫卫卫星星星星影影影影像像像像信信信信息息息息包包包包括括括括了了了了山山山山川川川川河河河河流流流流等等等等地地地地形形形形地地地地貌貌貌貌信信信信息息息息,可可可可结结结结合合合合上上上上述述述述环环环环境境境境信信信
22、信息息息息查查查查看看看看聚聚聚聚集集集集性性性性探探探探测结果。测结果。测结果。测结果。 a除除除除地地地地理理理理图图图图形形形形外外外外,GEGE还还还还可可可可容容容容纳纳纳纳预预预预警警警警信信信信号号号号的的的的相相相相关关关关重重重重要信息要信息要信息要信息 。aGEGE操作十分简便,便于推广应用。操作十分简便,便于推广应用。操作十分简便,便于推广应用。操作十分简便,便于推广应用。 省级前瞻性时空聚集性探测结果图示省级前瞻性时空聚集性探测结果图示省级前瞻性时空聚集性探测结果图示省级前瞻性时空聚集性探测结果图示1 1 1 1图7.12 区县级前瞻性时空聚集性探测结果图示1图7.13
23、 区县级前瞻性时空聚集性探测结果图示2Figure. 聚集性探测结果在聚集性探测结果在Google Earth上的平面透视图上的平面透视图(在预警信号所在位置点击鼠标左键,即可出现预警信号的详细信息,包括时间、地域、实际发病数、预期发病数、P值)时空两个维度聚集性探测的优势时空两个维度聚集性探测的优势 与与单单纯纯时时间间聚聚集集性性分分析析相相比比,时时空空聚聚集集性性分分析析信信息息更更为为详详尽尽,不不仅仅可可提提示示有有无无聚聚集集性性,还还可可对对聚聚集集性性进进行行空空间间定位。定位。 时空两个维度聚集性探测的优势时空两个维度聚集性探测的优势 时时空空聚聚集集性性分分析析充充分分利
24、利用用了了数数据据中中的空间信息,的空间信息,预警更为及时。预警更为及时。 H0:传染病无聚集性传染病无聚集性(病例随机分布病例随机分布)拒绝拒绝H0对应爆发?对应爆发?“偶然偶然”?信息不真实?信息不真实?存在聚集性存在聚集性与散发相对与散发相对散发:独立发生的病例。散发:独立发生的病例。爆发:病例之间具有流行病学上的联系。爆发:病例之间具有流行病学上的联系。流行病学意义上的传染病爆发流行病学意义上的传染病爆发统计统计聚集性聚集性流行病学流行病学爆发爆发是否对应?是否对应?现场调查现场调查:确定病例之间的流行病学联系。:确定病例之间的流行病学联系。实验室检查实验室检查:根据病原体染色体:根据
25、病原体染色体DNA的同的同源程度识别病例之间的联系源程度识别病例之间的联系(更为准确更为准确)。聚集性的原因空间自相关其它因素是否需校正空间自相关?是否需校正空间自相关?取决于需要从数据中获取取决于需要从数据中获取什么样的信息什么样的信息 ?情况k通通过过空空间间自自回回归归分分析析确确定定主主要要影影响响因因素素:如如分分析析发发病病人人群群的的主主要要特特征征,此此时时需需校校正空间自相关正空间自相关。k否否则则可可能能高高估估危危险险性性,使使得得本本来来没没有有关关联的因素得到具有统计学意义的结果。联的因素得到具有统计学意义的结果。 Y探探测测传传染染病病爆爆发发:勿勿需需校校正正空空
26、间间自自相相关关。因因为为所所要要探探测测的的cluster很很可可能能是是空空间间自自相相关关引引起起的的。如如果果对对其其进进行行校校正正,就就发发现现不不了重要的了重要的cluster。Y因因此此,应应用用于于早早期期预预警警模模型型的的时时空空扫扫描描统统计量计量无需无需对空间自相关进行校正。对空间自相关进行校正。 情况多源监测数据融合分析技术多源监测数据融合分析技术Multivariate surveillance data analysisCompany LogoCompany Logol l在在在在传传传传染染染染病病病病监监监监测测测测工工工工作作作作中中中中,除除除除病病病病
27、例例例例监监监监测测测测和和和和症症症症候候候候群群群群监监监监测测测测数数数数据据据据外外外外,还还还还可可可可通通通通过过过过多多多多个个个个渠渠渠渠道道道道获获获获得得得得相相相相关关关关数数数数据据据据,如如如如医医医医院院院院就就就就诊诊诊诊数数数数据据据据,药药药药店店店店OTCOTC药药药药物物物物销销销销量量量量数数数数据据据据、学学学学校校校校缺缺缺缺席席席席人人人人数数数数等等等等,多多多多源源源源数数数数据据据据融融融融合合合合分分分分析析析析技技技技术术术术可可可可合合合合并并并并多多多多数数数数据据据据源源源源建建建建模模模模进进进进行行行行传传传传染病的预测和早期预
28、警染病的预测和早期预警染病的预测和早期预警染病的预测和早期预警。 Company Logo贝叶斯网络贝叶斯网络Bayesian NCompany Logol l贝叶斯网络是一种基于贝叶斯理论的概率推理图贝叶斯网络是一种基于贝叶斯理论的概率推理图贝叶斯网络是一种基于贝叶斯理论的概率推理图贝叶斯网络是一种基于贝叶斯理论的概率推理图形化网络,即通过一些形化网络,即通过一些形化网络,即通过一些形化网络,即通过一些监测监测监测监测变量的信息来获取其变量的信息来获取其变量的信息来获取其变量的信息来获取其他他他他感兴趣感兴趣感兴趣感兴趣变量概率信息的过程。变量概率信息的过程。变量概率信息的过程。变量概率信息
29、的过程。l l目前目前目前目前已在众多领域获得广泛应用,是近年国外传已在众多领域获得广泛应用,是近年国外传已在众多领域获得广泛应用,是近年国外传已在众多领域获得广泛应用,是近年国外传染病预警研究领域的前沿技术之一。染病预警研究领域的前沿技术之一。染病预警研究领域的前沿技术之一。染病预警研究领域的前沿技术之一。贝叶斯网络基本原理贝叶斯网络基本原理贝叶斯网络贝叶斯网络节点:变量(season、age )有向弧段:变量间的相互关系 ExampleExample:炭疽释放:炭疽释放:炭疽释放:炭疽释放全全全全局局局局节节节节点点点点G G G G,指指指指示示示示是是是是否否否否存在炭疽释放。存在炭疽
30、释放。存在炭疽释放。存在炭疽释放。Example:炭疽释放界界界界面面面面节节节节点点点点I I I I,在在在在图图图图中中中中为为为为扩扩扩扩散散散散的时间和地点的时间和地点的时间和地点的时间和地点 Example:炭疽释放个体子网络个体子网络个体子网络个体子网络P P P P,每个子网络,每个子网络,每个子网络,每个子网络对应一个个体。对应一个个体。对应一个个体。对应一个个体。 个体子网络中包含家庭地理编码、年龄、性别、呼吸个体子网络中包含家庭地理编码、年龄、性别、呼吸个体子网络中包含家庭地理编码、年龄、性别、呼吸个体子网络中包含家庭地理编码、年龄、性别、呼吸道主诉、发病时间、发病地点等
31、个人信息。道主诉、发病时间、发病地点等个人信息。道主诉、发病时间、发病地点等个人信息。道主诉、发病时间、发病地点等个人信息。Example:炭疽释放人人人人群群群群证证证证据据据据节节节节点点点点OO,代代代代表表表表了了了了特特特特定定定定群群群群体体体体的的的的集集集集合合合合证证证证据据据据。这这这这里里里里OO代代代代表每个地区的非处方药物的合计销量。表每个地区的非处方药物的合计销量。表每个地区的非处方药物的合计销量。表每个地区的非处方药物的合计销量。 l l贝叶斯网络将多个渠道获得的个体数据和集合数据以网络的形式有机地结合起来,在充分考虑变量之间复杂关系的基础上,对传染病暴发的概率进
32、行估计。贝叶斯网络建立步骤贝叶斯网络建立步骤数据收集数据收集数据收集数据收集v医医医医院院院院/ / / /社社社社区区区区卫卫卫卫生生生生服服服服务务务务中中中中心心心心监监监监测测测测资资资资料料料料:患患患患者者者者的的的的人人人人口口口口学学学学信信信信息息息息、发发发发病病病病及及及及就就就就诊诊诊诊时时时时间间间间、家家家家庭庭庭庭住住住住址址址址、临临临临床床床床症症症症候候候候群等;群等;群等;群等;v120120120120紧急医疗救助电话记录电子记录;紧急医疗救助电话记录电子记录;紧急医疗救助电话记录电子记录;紧急医疗救助电话记录电子记录;v药店监测资料:相关药物每日销售量
33、;药店监测资料:相关药物每日销售量;药店监测资料:相关药物每日销售量;药店监测资料:相关药物每日销售量;v学学学学校校校校、托托托托幼幼幼幼机机机机构构构构、养养养养老老老老机机机机构构构构监监监监测测测测资资资资料料料料:各各各各监监监监测测测测点点点点机构缺勤人数及原因。机构缺勤人数及原因。机构缺勤人数及原因。机构缺勤人数及原因。v.Company Logo指标选择指标选择指标选择指标选择v召召召召开开开开包包包包括括括括传传传传染染染染病病病病应应应应急急急急处处处处置置置置专专专专业业业业人人人人员员员员、流流流流行行行行病病病病学学学学家家家家、临临临临床床床床专专专专家家家家等等等
34、等症症症症候候候候群群群群监监监监测测测测涉涉涉涉及及及及的的的的相相相相关关关关领领领领域域域域的的的的专业人员在内的专家会议。专业人员在内的专家会议。专业人员在内的专家会议。专业人员在内的专家会议。v根根根根据据据据不不不不同同同同症症症症候候候候群群群群的的的的目目目目标标标标传传传传染染染染病病病病,整整整整理理理理各各各各类类类类症症症症候候候候群群群群发发发发生生生生的的的的影影影影响响响响因因因因素素素素,考考考考虑虑虑虑变变变变量量量量间间间间的的的的依依依依赖赖赖赖关关关关系系系系,相相相相关关关关数数数数据据据据的的的的可可可可获获获获得得得得性性性性和和和和可可可可量量量
35、量化化化化性性性性等等等等,选选选选取取取取适适适适宜宜宜宜的模型指标。的模型指标。的模型指标。的模型指标。Company Logo网络结构学习网络结构学习v利利用用历历史史数数据据,结结合合先先验验知知识识,确确定定合合适适的的贝贝叶斯网络拓扑结构。叶斯网络拓扑结构。v根据实际情况选用以下两种方法:根据实际情况选用以下两种方法:v基于统计测试的方法基于统计测试的方法v基于搜索记分的方法基于搜索记分的方法 Company Logov拟建立的模型节点分为四部分:拟建立的模型节点分为四部分:拟建立的模型节点分为四部分:拟建立的模型节点分为四部分:全局节点全局节点全局节点全局节点G G G G,即地
36、区全人群特征;,即地区全人群特征;,即地区全人群特征;,即地区全人群特征;界面节点界面节点界面节点界面节点I I I I,包括传染病扩散的时间和地点;,包括传染病扩散的时间和地点;,包括传染病扩散的时间和地点;,包括传染病扩散的时间和地点;个个个个体体体体网网网网络络络络P P P P,每每每每个个个个子子子子网网网网络络络络对对对对应应应应一一一一个个个个个个个个体体体体,包包包包括括括括人人人人口口口口学学学学信信信信息息息息、临临临临床床床床症症症症候候候候群群群群等等等等,其其其其拓拓拓拓扑扑扑扑网网网网络络络络结结结结构构构构由专家判断确定;由专家判断确定;由专家判断确定;由专家判断
37、确定;人人人人群群群群证证证证据据据据节节节节点点点点O O O O,包包包包括括括括非非非非处处处处方方方方药药药药物物物物的的的的销销销销量量量量、120120120120紧急医疗救助电话记录、机构缺勤人数等。紧急医疗救助电话记录、机构缺勤人数等。紧急医疗救助电话记录、机构缺勤人数等。紧急医疗救助电话记录、机构缺勤人数等。Company Logo网络参数确定网络参数确定网络参数确定网络参数确定v 在给定贝叶斯网络拓扑结构的情况下,在给定贝叶斯网络拓扑结构的情况下,在给定贝叶斯网络拓扑结构的情况下,在给定贝叶斯网络拓扑结构的情况下,确定各节点处的条件概率密度。贝叶斯网络的参确定各节点处的条件
38、概率密度。贝叶斯网络的参确定各节点处的条件概率密度。贝叶斯网络的参确定各节点处的条件概率密度。贝叶斯网络的参数学习通过专家知识和训练样本学习来确定。数学习通过专家知识和训练样本学习来确定。数学习通过专家知识和训练样本学习来确定。数学习通过专家知识和训练样本学习来确定。v 参数估计方法:极大似然估计、极大后参数估计方法:极大似然估计、极大后参数估计方法:极大似然估计、极大后参数估计方法:极大似然估计、极大后验概率和期望极大化算法。验概率和期望极大化算法。验概率和期望极大化算法。验概率和期望极大化算法。v 当后验概率超过界值可能是一次暴发。当后验概率超过界值可能是一次暴发。当后验概率超过界值可能是
39、一次暴发。当后验概率超过界值可能是一次暴发。Company Logo网络结构和参数的优化网络结构和参数的优化网络结构和参数的优化网络结构和参数的优化v采采采采用用用用AMOCAMOC(activity (activity monitoring monitoring operating operating characteristic)characteristic)曲曲曲曲线线线线衡衡衡衡量量量量模模模模型型型型的的的的假假假假阳阳阳阳性性性性率率率率,计计计计算算算算传传传传染染染染病病病病出出出出现现现现暴暴暴暴发发发发时时时时间间间间和和和和模模模模型型型型预预预预警警警警时时时时间间间间
40、的的的的差差差差值,并通过评价结果对模型结构进行优化。值,并通过评价结果对模型结构进行优化。值,并通过评价结果对模型结构进行优化。值,并通过评价结果对模型结构进行优化。Company Logo隐马尔科夫模型隐马尔科夫模型Hidden Markov Models,HMMs Company Logo隐马尔科夫模型l l隐隐隐隐马马马马尔尔尔尔科科科科夫夫夫夫模模模模型型型型( (HMMsHMMs) )是是是是在在在在MarkovMarkov模模模模型型型型的的的的基基基基础上发展起来的统计模型。础上发展起来的统计模型。础上发展起来的统计模型。础上发展起来的统计模型。Company Logo假假假假
41、定定定定HMMsHMMs的的的的状状状状态态态态( (传传传传染染染染病病病病状状状状态态态态) )是是是是不不不不可可可可直直直直接接接接监监监监测测测测的的的的,监监监监测测测测到到到到的的的的只只只只是是是是与与与与之之之之对对对对应应应应的的的的一一一一些些些些监监监监测测测测值值值值( (如如如如OTCOTC销销销销售售售售量量量量、急急急急诊诊诊诊量量量量和和和和学学学学校校校校缺缺缺缺勤勤勤勤数数数数等等等等 ) ),因因因因而而而而称称称称之为之为之为之为“ “隐隐隐隐” ”马尔科夫模型。马尔科夫模型。马尔科夫模型。马尔科夫模型。 隐马尔科夫模型底层底层底层底层:Markov:
42、Markov链模型链模型链模型链模型描述状态之间的转换描述状态之间的转换描述状态之间的转换描述状态之间的转换Company Logo隐马尔科夫模型上层上层上层上层: : : :随机模型,随机模型,随机模型,随机模型,描述状态与监测值的描述状态与监测值的描述状态与监测值的描述状态与监测值的统计对应关系。统计对应关系。统计对应关系。统计对应关系。Company Logo隐马尔科夫模型l lHMMsHMMs建建建建模模模模是是是是从从从从历历历历史史史史数数数数据据据据中中中中获获获获取取取取信信信信息息息息,将将将将隐隐隐隐含含含含的的的的规规规规律律律律转转转转化化化化为为为为实实实实际际际际的
43、的的的模模模模型型型型参参参参数数数数,利利利利用用用用历历历历史史史史信信信信息息息息并并并并根根根根据据据据相相相相似性似性似性似性原理来原理来原理来原理来比较识别未知样本。比较识别未知样本。比较识别未知样本。比较识别未知样本。Company Logo隐马尔科夫模型l l国国国国外外外外在在在在进进进进入入入入2121世世世世纪纪纪纪后后后后,将将将将其其其其运运运运用用用用于于于于流流流流感感感感样样样样病病病病例例例例、脊脊脊脊髓灰质炎以及医院感染等监测资料预测疾病状态。髓灰质炎以及医院感染等监测资料预测疾病状态。髓灰质炎以及医院感染等监测资料预测疾病状态。髓灰质炎以及医院感染等监测资
44、料预测疾病状态。Company Logo隐马尔科夫模型结构图q qt t为为为为t t时刻的隐状态时刻的隐状态时刻的隐状态时刻的隐状态( (传染病暴发的有无传染病暴发的有无传染病暴发的有无传染病暴发的有无) ) 隐马尔科夫模型结构图O Ot t为为为为t t时刻观察到的监测时刻观察到的监测时刻观察到的监测时刻观察到的监测资料资料资料资料( (如如如如OTCOTC销售量、销售量、销售量、销售量、急诊量和学校缺勤数等急诊量和学校缺勤数等急诊量和学校缺勤数等急诊量和学校缺勤数等 ) ) 由由由由于于于于传传传传染染染染病病病病状状状状态态态态( (隐隐隐隐状状状状态态态态) )难难难难以以以以确确确
45、确定定定定,HMMsHMMs是是是是通通通通过过过过可可可可获获获获得得得得的的的的监监监监测测测测数数数数据据据据来来来来反反反反推推推推传传传传染染染染病的可能状态。病的可能状态。病的可能状态。病的可能状态。 多源监测数据的多源监测数据的多源监测数据的多源监测数据的HMMsHMMs示意图示意图示意图示意图学校缺勤数学校缺勤数学校缺勤数学校缺勤数急诊量急诊量急诊量急诊量抗组胺类抗组胺类抗组胺类抗组胺类OTCOTC销售量销售量销售量销售量扩展模型扩展模型隐马尔科夫模型结构图隐马尔科夫模型结构图隐马尔科夫模型结构图隐马尔科夫模型结构图E Et t为为为为O Ot t的的影响因素的的影响因素的的影
46、响因素的的影响因素 ( (周末或假期效应、零周末或假期效应、零周末或假期效应、零周末或假期效应、零售业促销手段等售业促销手段等售业促销手段等售业促销手段等 ) ) Company LOGO模型建立过程模型建立过程模模模模型型型型训训训训练练练练。即即即即模模模模型型型型参参参参数数数数估估估估计计计计问问问问题题题题,就就就就是是是是对对对对于于于于初初初初始始始始模模模模型型型型和和和和给给给给定定定定用用用用于于于于训训训训练练练练的的的的观观观观测测测测序序序序列列列列调调调调整整整整模模模模型型型型的的的的参参参参数数数数,使使使使其其其其能能能能够够够够最最最最好好好好拟拟拟拟合合合
47、合观观观观测测测测数数数数据据据据,可可可可通通通通过过过过EMEM算算算算法法法法或或或或Baum-Welch Baum-Welch 算法进行。算法进行。算法进行。算法进行。Company LOGO模模模模型型型型评评评评价价价价。给给给给定定定定模模模模型型型型参参参参数数数数, ,计计计计算算算算观观观观测测测测序序序序列列列列的的的的似似似似然然然然度度度度, ,即即即即计计计计算算算算似似似似然然然然值值值值或或或或对对对对数数数数似似似似然然然然值值值值,用用用用于于于于表表表表示示示示参参参参数数数数拟拟拟拟合合合合数数数数据据据据的的的的准准准准确确确确程程程程度度度度。这这这
48、这可可可可以以以以通通通通过过过过前前前前向向向向- -后后后后向向向向算算算算法进行法进行法进行法进行。1 1、2 2步需反复进行,选择似然值或对数似然值步需反复进行,选择似然值或对数似然值步需反复进行,选择似然值或对数似然值步需反复进行,选择似然值或对数似然值最大的参数作为最终模型参数。最大的参数作为最终模型参数。最大的参数作为最终模型参数。最大的参数作为最终模型参数。Company LOGO隐隐隐隐状状状状态态态态估估估估计计计计。给给给给定定定定模模模模型型型型参参参参数数数数和和和和观观观观测测测测数数数数据据据据,基基基基于于于于某某某某种种种种最最最最优优优优准准准准则则则则估估
49、估估计计计计最最最最可可可可能能能能的的的的隐隐隐隐状状状状态态态态序序序序列列列列( (传传传传染染染染病病病病状状状状态态态态的的的的时时时时间间间间序序序序列列列列), ), 即即即即估估估估计计计计出出出出产产产产生生生生观观观观测测测测序序序序列列列列的的的的最最最最可可可可能路径,可通过能路径,可通过能路径,可通过能路径,可通过ViterbiViterbi 算法进行估计。算法进行估计。算法进行估计。算法进行估计。历史数据历史数据历史数据历史数据最优最优HMMs传染病预警传染病预警传染病预警传染病预警参数训练及评估参数训练及评估参数训练及评估参数训练及评估模型用于新监测数据模型用于新监测数据模型用于新监测数据模型用于新监测数据谢谢 谢!谢!