大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件

上传人:我*** 文档编号:145749278 上传时间:2020-09-23 格式:PPT 页数:41 大小:1.49MB
返回 下载 相关 举报
大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件_第1页
第1页 / 共41页
大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件_第2页
第2页 / 共41页
大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件_第3页
第3页 / 共41页
大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件_第4页
第4页 / 共41页
大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件》由会员分享,可在线阅读,更多相关《大数据时代数据使用者观念的变化疾病预防控制工作对于信息的要求课件(41页珍藏版)》请在金锄头文库上搜索。

1、金水高 云南,腾冲 2013.12.5,大数据时代卫生统计面临的挑战与机遇,报 告 内 容,大数据的概念 卫生系统大数据的特点 应对,大数据的概念,大数据概念,什么是大数据? 大是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。 信息化使我们进入了大数据时代。 大数据的基本特征:可以用4个V来总结 数据量(Volume)大 多样性(Variety):数据类型繁多。已经超出我们所理解的范围。 价值密度低(Value):例如一些国家对居民的短信、电话进行监听,大街上到处是探头,收集了大量的信息,但是有用的不多,不过可以获取重要的信息。 处理速度快(Velocity):随

2、时随地、每时每刻、每秒都在产生无穷的数据,在很短的时间里可以传遍全世界只要需要。,大数据概念,什么是大数据? 所以,“大数据”不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。 大数据研发目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展。因此,大数据时代带来的挑战不仅体现在如何处理巨量数据从中获取有价值的信息,也体现在如何加强大数据技术研发,抢占时代发展的前沿。,卫生系统大数据的特点,随着信息技术的飞速发展,尤其是网络技术的应用,导致卫生数据的收集方式发生了巨大的变化。 反映为四多一少。 1.数据来源多了,收集渠道多样化了 以往:多来自现场调查,

3、检测 现在:增加了来自信息系统收集的数据,对于突发事件的监测报告,通过常规疾病监测系统的数据收集,手机的数据收集,卫生监督系统采用的手持执法终端,医院影象数据等,卫生系统大数据的特点,Internet,国家级平台Intranet,省级平台 Intranet,地市级平台 Intranet,调制解调器,县区级工作站,乡镇卫生院,网络电话,PC工作站,PSTN,DDN,DDN,五级网络 三级平台,纵向到底,安全隧道(VPN),国家传染病网络直报系统,2020/9/23,(1)传染病与突发公共卫生事件监测信息系统 (2)传染病公共卫生实验室监测信息系统 (3)慢性非传染性疾病监测与信息管理系统 (4)

4、健康危险因素监测与风险评估信息系统 (5)预防接种信息系统 (6)生命登记信息系统 (7)疾病预防控制绩效考核与爱国卫生信息系统,十二五卫生信息化规划 公共卫生信息化建设内容,2020/9/23,(8)出生医学登记管理信息系统 (9)儿童健康管理与服务评估信息系统 (10)出生缺陷监测与干预信息系统 (11)孕产妇健康管理与服务评估信息系统 (12)重大妇女病监测信息系统 (13)妇幼保健数据分析与决策支持信息系统,十二五卫生信息化规划公共卫生信息化建设内容(续),2020/9/23,(14)卫生监督对象管理信息系统 (15)卫生行政许可审批信息系统 (16)卫生监督检查和行政处罚信息系统 (

5、17)食品安全风险监测与应急处理信息系统 (18)食品安全与卫生监督决策支持与信息发布系统 (19)突发公共事件卫生应急指挥决策系统,十二五卫生信息化规划公共卫生信息化建设内容(续),智能衬衫、腰带、腕表、呼吸运动传感器、及耳麦、项圈等日常用品的传感嵌入,能够搜集心跳、体温、呼吸节奏、血压等重要体征数据,基于物联网传感器的健康信息监控系统,定期自动测量个体的重要健康信息,存储并传送到电子病历系统中,具有医疗保健测试功能的穿戴式传感器,2.数据的内容丰富了 举例: 2009年党中央国务院的医改中提出要在全国建立居民健康档案,要推进公共卫生服务的均等化后,极大地丰富了数据的内容。卫生部及时地出台了

6、建设基于居民电子健康档案的区域卫生信息平台的指南与相应的技术文件。 由于疾病预防控制的需求越来越强,尤其是对于突发公共卫生事件的预警预测,收集积累了大量的相关资料。 从疾病预防控制的角度,我们不仅关注人的某个阶段的健康指标,而且更关心人生命的全过程及其与环境的关联,因此收集的内容也更为丰富。,资料的收集,国家区域卫生信息平台系统总体架构,基于区域卫生信息平台的信息收集与交换,上海市某区的卫生信息网络框架图,构建了覆盖卫生局、区域医疗中心、专业站所、社区卫生服务中心、社区卫生服务站点、村卫生室、居(村)委的网络体系,骨干光纤网络 全网100M到桌面,居民,3. 数据之间的关联性更强了 传统:我们

7、比较多关心的是一个数据集内部的变量之间的关联。 当前的关联范围更宽泛: 1)时序性:同一个变量具有在时间上的连续性。 2)来自不同系统采集的数据之间的关联,资料的收集,社区,区域卫生信息网,疾控机构,医疗机构,保险机构,卫生监督,决策部门,横向到边,科研部门,信息模块接口 的标准化保障,其它机构,传染病报告,体检,免疫,监测,实验室,医技,统计,医院,结核病防治所站,辖区医院/社区,区域卫生信息平台,门诊临床,住院临床,医疗单位发现1例肺结核病人,推送区域信息平台,对病情进行监测,慢病跟踪指导,疾控中心,诊疗,检查,慢病跟踪,保健,启动,报告CDC,报告慢病,转出,慢病站做出 诊断,转院处理,

8、转入,指导,核实诊断,处理,接报,转回所管辖医疗单位继续诊治,做出治疗 方案,举例:基于区域卫生信息平台的结核病防治结合的业务互动,数据之间的关联关系更加复杂了:上海市的死因登记数据流程,4. 数据量的无限膨胀 从有限数据到海量数据的积累 国家传染病网络直报网,从2004年起,每年上报的传染病个案达300-500万条。 海量的数据,是一个巨大无比的信息源。,资料的收集,四多一少的少是指:有严格统计设计的数据收集少了! 1)没有抽样设计:是常规工作的积累 2)质量控制不严格:数据缺失、错误比较严重 这是我们当前卫生统计工作者面临的大环境。 也是我们面临的新挑战。,资料的收集,随着信息技术的飞速发

9、展,尤其是网络技术的应用,数据的收集方式的变化,也带来了数据存贮方式的变化。 各种信息系统每时每刻实时收集着各种类型的数据; 信息技术的发展也使存贮方式发生了个革命性的变化:从集中式存贮到分布式的存贮。 尤其是居民健康档案,任何一个再大的存贮系统,都难以将几百万居民的健康档案放在一个数据中心。而且也不允许这样做。,资料的存贮管理,国家区域卫生信息平台系统,大数据时代卫生统计工作者面临的挑战,收集:大数据的采集是指利用多个数据库来接收发自客户端(Web、App或者传感器形式等)的数据,在大数据的采集过程中,其主要特点和挑战是并发数高,因为同时有可能会有成千上万的用户来进行访问和操作。 核查/整理

10、:导入/预处理:将这些来自前端的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做一些简单的清洗和预处理工作 分析:挑战是分析涉及的数据量大,其对系统资源,特别是I/O会有极大的占用,数据挖掘 服务:满足于不同用户需求的信息发布。实际是根据不同用户需求的分析及结果的提供。,传统卫生统计数据处理流程,管理决策者的需求更加迫切了决策者更依赖于利用数据、信息来做决策 例:中盖基金结核病项目II期中筹资与支付的例子: 如何降低患者的负担,怎么评价?怎么利用日常监测数据发现项目实施中的问题?,大数据时代数据使用者观念的变化,疾病预防控制工作对于信息的要求更高了 卫生应急的需

11、求 突发事件的预报预警要求 疾病预测(如出血热) 等,大数据时代数据使用者观念的变化,用户对于问题的认识深化了:不再满足于一般的统计分析与应用 最近艾滋病中心出现的问题就反映出对于数据的利用不能再满足于一般的统计分析,而是要深入挖掘,建立相关的模型。 对于手足口病的分析 复杂抽样下总体的估计,大数据时代数据使用者观念的变化, 流行病学研究中的复杂抽样 对于统计研究总是从样本推断总体。 条件是:样本代表总体。 在复杂抽样中怎么估计总体参数? 什么叫复杂抽样:就是综合应用四种基本抽样方法下的抽样。 比如分层、多阶段随机抽样。,大数据时代数据使用者观念的变化:复杂抽样的例子,2002年中国 居民营养

12、与健康状况调查抽样方案 多阶段分层整群随机抽样。 将全国划分为大城市、中小城市及四类农村,共6层。 抽取最终调查样本时采用逐级抽样的方法。 第一阶段在每层抽取22个县区级单位; 第二阶段在抽中的每个县区中随机抽取3个乡镇/街道; 第三阶段在每个抽中的街道中随机抽取2个村/居委会; 第四阶段在每个村、居委会随机抽取90户家庭。 对所抽到的家庭户中每个成员进行相关的调查。 这样实际上每个个体被抽中的概率是不一样的。 原因是,在每个阶段中在不同分总体中所抽到的抽样单元(如区县),其抽中的概率是不相同的。如第一阶段抽样,分总体为6层,每层中的单元数不同,但是我们抽取的区县数都是22个。 那么我们就不能

13、采用一般的通过年龄性别进行调整的方法来获得总体的参数。,大数据时代数据使用者观念的变化:复杂抽样的例子,对于所有抽样方案,几乎都采用这样的调整。 在复杂抽样的情况下,不合适。 因为实际上,每个个体抽中的概率并不相同。,传统的率的调整方法,大数据时代数据使用者观念的变化:复杂抽样的例子,复杂抽样总体的参数及其变异的估计实际上是估计出每个个体被抽中的概率,他所代表的权重,再利用加权的方法估计。,该个体抽样的权重 w=w1*w2*w3*w4,* 刘建华等:复杂抽样调查总体特征量及其方差的估计。中国卫生统计 2008,25(4):377-379,大数据时代数据使用者观念的变化: 复杂抽样的例子,管理者

14、的分析需求增加了 过程分析:不仅要进行终末分析,而且需要中间过程的动态分析。这一点,尤其是在医院,需求更为迫切。在执行项目中,经常需要对项目的实施质量进行跟踪,就要采集项目实施的数据进行阶段性的分析。 项目实施的监测与评估,统计分析中的新问题:管理者的需求增加了,2003年的SARS,使人们对于出现的突发公共卫生事件的关注程度增加了。人们很关心什么时候会出现想不到的事件,想方设法探讨进行预报预警的方法。 在这个方面,统计工作者被赋予重要的职责,进行了极大的努力,发表了大量的文章国内外莫不如此。 但是结果呢? 可以这样说,还没有一个成功的案例。 为什么? 说明对于疾病与突发公共卫生事件的预警已经

15、超越了目前我们所掌握的经典统计方法的传统思路。统计工作者应该摆脱传统模式的束缚,探求新的进行疾病预警的方法。,统计分析中的新问题:管理者的需求增加了,数据收集中的正规设计少了 带来的问题: 数据收集的质量控制少了:数据缺失,数据错误现象严重存在。 网络报告的数据,漏报(指报告 不完整)、缺失(指报告的项目填写不完全)、错误普遍存在。 传统的统计方法是在严格的统计设计基础上进行的。现在没有了严格的统计设计,没有了抽样的概念,缺乏了数据收集的质量控制,我们怎么从样本推断总体?,统计分析中的新问题数据的来源变化了,数据收集的渠道增加了 数据的内容扩展了。 数据的存贮分散了。 其优势是增加了许多值得利

16、用的资料。 同时并存的是: 数据的质量保证机制的缺失; 数据的整理复杂性。,统计分析中的新问题数据的来源变化了,连续动态资料的分析 与以往一次性调查的数据不同,通过信息系统采集的大量数据是实时的、动态的。 在大的项目实施中,由于项目实施的时间有先后,实施的进度有差异,数据是不断进入数据库的。尤其是健康档案的建设,更存在这样的问题。,统计分析中的新问题数据的收集方式变了,有人提出我国大数据研发的四个着力点为: 一是建立一套运行机制: 大数据建设是一项有序的、动态的、可持续发展的系统工程,必须建立良好的运行机制,以促进建设过程中各个环节的正规有序,实现统合,搞好顶层设计。 二是规范一套建设标准: 应建立面向不同主题、覆盖各个领域、不断动态更新的大数据建设标准,为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。,我国大数据研发建设的四个着力点,三是搭建一个共享平台 应在各专用数据库建设的基础上,通过数据集成,实现各级各类指挥信息系统的数据交换和数据共享。 四是培养一支

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号