浅谈生物医学大数据及其应用

上传人:金**** 文档编号:94994915 上传时间:2019-08-14 格式:PPTX 页数:27 大小:5.43MB
返回 下载 相关 举报
浅谈生物医学大数据及其应用_第1页
第1页 / 共27页
浅谈生物医学大数据及其应用_第2页
第2页 / 共27页
浅谈生物医学大数据及其应用_第3页
第3页 / 共27页
浅谈生物医学大数据及其应用_第4页
第4页 / 共27页
浅谈生物医学大数据及其应用_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《浅谈生物医学大数据及其应用》由会员分享,可在线阅读,更多相关《浅谈生物医学大数据及其应用(27页珍藏版)》请在金锄头文库上搜索。

1、浅谈生物医学大数据及其应用 基于组学数据的因果推断与疾病预后,魏永越, MD, PhD 陈峰,教授,博导 南京医科大学公共卫生学院 3月26日武汉,概 述,整合策略及方法,实例分析,讨 论,概 述,实例分析,讨 论,整合策略及方法,生物(健康)数据之特点,优点: 质量高、精确性好 缺点: 单个变量效应微弱 变量间关系复杂,实时采集数据 实时分析数据 实时结局预警,单个数据集分析的局限性,Cell, 2014,Big Data, being pooled,48 GWAS + Validation sets,339,224 individuals,Big Data, being pooled,11

2、 GWAS + 41 custom array studies,21594 cases vs. 54156 controls,Big Data, being Bigger,基线 多态性 拷贝数 甲基化 转录组 蛋白组 代谢组,样 本,样本类型 样本数量 数据种类 离散程度,实时 健康数据,Big Data, being Integrated,概 述,整合策略及方法,实例分析,讨 论,How to deal with.,基线 多态性 拷贝数 甲基化 转录组 蛋白组 代谢组,样 本,block missing disaster,多组学数据整合,双重双向填补法整合数据,“盘活”已有数据, 提高数据的

3、“完整性”,达到充分利用的目的。,Nature Biotechnology,2015,块状缺失数据填补,要求: 快! 尽可能维持方差/协方差结构不变 传统方法: 均值填补,MCMC填补 机器学习方法: Multi-layer perceptron(多层感知机,MLP) KNN填补,Bridging by COV,Listwise deletion(LD) 只利用#7#12号记录 Pairwise deletion(PD) 计算方差协方差矩阵时只考虑两个变量间的缺失 消去变换法,高维数据快速初筛,ERB筛选法,Journal Cover Cancer Discovery (IF=19). 11

4、February 2014,Journal Cover Cancer Cell (IF=23). 11 February 2013,Borrow information from human body,Biological network analysis,多组学联合筛检中的效应分解 中介分析(Mediation analysis),Baron&Kenny,1986 Tyler VanderWeele, 2010PMID: 25000145,Google Scholar, cited 5w Web of Science, cited 2w,direct effectdirect causal

5、effect,all unexplainable effect,概 述,整合策略及方法,实例分析,讨 论,实例1:基于组学数据的因果推断 genetic variationPLT ARDS患病风险,Wei Y, Chen F, et al. Chest 2015. IF 7.483,实例2:基于组学数据的因果推断 genetic variationPLT ARDS预后,Wei Y, Chen F, et al. AJRCCM 2016. IF 13.118,实例3:基于组学数据的因果推断 环境砷暴露扰乱脐带血代谢 低出生体重,Wei Y, Chen F. J Expo Sci Env Epi

6、2016. IF 3.141,概 述,整合策略及方法,实例分析,讨 论,讨论,统计学知识+生物学先验老数据玩出新花样 多样化健康数据实时采集更精确的统计建模/预测 用数据指导更健康生活 宏观健康数据+微观数据精细分析、干预切入点 因果推断方法为后续功能实验提供更充分的依据 任何数据都是有价值的!就看怎么利用!怎么解释!,讨论,大数据思维,数据量大 大数据。 大数据就是全数据; 大数据思维就是全局思维; 大数据分析就是利用一切有用信息寻找事物内部的客观规律。,何谓大数据?,中国 北纬46度至48度,既往初步 勘探数据,哈尔滨到齐齐哈尔之间,机器类型 推测油井直径/深度,井架密度推测产量,日本公司招标获胜毫无悬链! 高价推销炼油设施!,或许,我们缺的不是数据。 是缺少一双发现美的慧眼!,Team: Feng Chen Yang Zhao Qianwen Shi Sipeng Shen,JWA study: Jianwei Zhou Jin Xu . ARDS Study: David C. Christiani Paula Tejera,Data from: NJMU HSPH TCGA .,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号