《人类疾病网络》ppt课件

上传人:san****019 文档编号:83639950 上传时间:2019-02-28 格式:PPT 页数:72 大小:1.91MB
返回 下载 相关 举报
《人类疾病网络》ppt课件_第1页
第1页 / 共72页
《人类疾病网络》ppt课件_第2页
第2页 / 共72页
《人类疾病网络》ppt课件_第3页
第3页 / 共72页
《人类疾病网络》ppt课件_第4页
第4页 / 共72页
《人类疾病网络》ppt课件_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《《人类疾病网络》ppt课件》由会员分享,可在线阅读,更多相关《《人类疾病网络》ppt课件(72页珍藏版)》请在金锄头文库上搜索。

1、人类疾病网络,张媛媛 2010.12.20,1,2019年2月28日5时3分,背景 在刻画人类疾病位点的研究中,很多疾病基因的位置克隆和全基因组的关联研究,产生了疾病与基因的关联对列表。 另外,蛋白质相互作用,人类代谢图谱和调控网络等都为不同疾病基因间的相互作用提供了一些细节描述。,2,2019年2月28日5时3分,给出一个不同的方法,在细胞和有机体的组织的高水平上,探索人类遗传疾病和对应的疾病基因是否可以彼此相关联。通过提供有多个基因引起的疾病(基因座异质性)的例子来支持这个方法的有效性。比方说,脑肝肾综合症是由至少11个基因的变异引起的,所有的都与过氧化酶体的生物发生有关。还有由一个基因的

2、不同变异(等位基因异质性)的疾病。比方说,TP53的变异被关联到11个临床上不同的癌症相关疾病。 通过发展一个全部遗传疾病(疾病表型组)和全部疾病基因(疾病基因组)的关联框架,得到对疾病组学的全局认识。,3,2019年2月28日5时3分,结果和讨论,疾病组的构建: 构建两个不相交顶点集的二部图。一个集合对应所有的已知遗传疾病,另一个集合对应人类基因组的所有已知的疾病基因。如果一个基因的变异暗示了某种疾病的发生,则疾病和基因相关联。 疾病、疾病基因和他们之间的关系的列表都是从OMIM获得。到2005年12月,包含了1284种疾病和1777个疾病基因。 我们基于被疾病所影响的生理系统,将疾病分成2

3、2类疾病。,4,2019年2月28日5时3分,由疾病组的二部图可以产生两个相关的生物网络投影。一个是人类疾病网络(HDN),顶点是疾病,当两个疾病共享至少一个疾病基因时,二者关联。另一个是疾病基因网络(DGN),顶点是疾病基因,当两个基因关联到同一疾病时,二者相连。 然后,我们讨论了这些网络对于帮助我们理解和代表所有已知疾病和表型关联的框架的潜力。,5,2019年2月28日5时3分,6,2019年2月28日5时3分,HDN的性质: 如果一个人类疾病有不同并且唯一的遗传原因,那么HDN对应的是不连通的孤立点。但,获得的HDN包含了单个疾病间和疾病类间的很多关联。1284个疾病中,867个至少一个

4、边关联到其他疾病,516个疾病形成一个巨大的类,暗示很多疾病同其他疾病是同享遗传原因。 一个疾病关联的基因数目s有很宽的分布,暗示大多数疾病关联到少数基因,很少的疾病关联到很多基因。白血病s=37,结肠癌s=34等。HDN的度分布也是幂律的,结肠癌k=50,7,2019年2月28日5时3分,灰色表示linear binning;红色表示以2为底的对数数据,8,2019年2月28日5时3分,HDN有明显的聚类现象,但在不同疾病类之间有明显的不同。癌症类因为共享很多癌基因,所以紧密相连,并且还有很多疾病同癌症有强相关;代谢疾病没有明显的形成一个不同的类。如图三 为了量化这种差异,我们衡量了每个疾病

5、类的基因座异质性和连通性(HDN中彼此连接的一部分疾病)。如图四,红色代表较高的显著性,蓝色代表较低的显著性。发现癌症有着较高的异质性和连通性,而代谢类有较低的异质性和连通性。 基因座异质性:指多于一个基因的变异。用属于这个类的疾病中基因的平均数目(也就是节点的平均大小)来衡量。一个类的连通性:用在HDN中彼此互相关联的一部分疾病来衡量,9,2019年2月28日5时3分,10,2019年2月28日5时3分,11,2019年2月28日5时3分,DGN的性质 基因间的关联,代表了相关表型关联,他们代表了表型相关性的衡量,这个可以用在未来的研究中,同蛋白质相互作用、转录因子启动子相互作用、代谢相互作

6、用关联,发现新的遗传相互作用。 在DGN中,1377个疾病基因连接到其他基因,903个基因属于一个巨大的类。如图五 涉及多种疾病的基因数目急剧减少。如图六,12,2019年2月28日5时3分,13,2019年2月28日5时3分,14,2019年2月28日5时3分,HDN和DGN的功能类 在保持疾病和基因的度不变的情况下,在二部图基础上随机化重连边,得到的疾病网络的最大类的平均大小是64316,远大于实际HDN中的516。相似,基因网络的最大类的平均大小为108720,也远大于实际DGN中的903(P10(-4))。 这些不同显示了疾病和基因的重要的病理生理学类。在实际的网络中,疾病(基因)更倾

7、向于相同疾病类中疾病(基因)的相连。,15,2019年2月28日5时3分,疾病关联基因识别不同功能模块 大多数的疾病和疾病类对应细胞内网络中怎样的不同的功能模块仍然不清楚。 假设1:如果编码蛋白质的疾病关联基因在功能不同的模块中相互作用,则在这些疾病模块中的蛋白质比其他蛋白质更可能相互作用。 为了检验这种假设,建立了蛋白质相互作用网络,发现290个重叠的相互作用,是随机情况下的10倍。,2019年2月28日5时3分,16,同一个疾病关联的基因共享一般的细胞和功能特性,在Gene Ontology(GO)中注释。 假设2:如果HDN显示模块化组织,则与相同疾病关联的一组基因应该分享相似的细胞和功

8、能特性,正如在GO中注释的一样。 为了证实这个假设的有效性,对于GO的每个分支(生物过程、分子功能和细胞组分),我们测量了每个疾病的GO同质性。发现有很高的显著性。 GO同质性: , 是疾病i关联的有GO术语j的基因数目; 是与疾病i关联的有GO注释的所有基因数目。,2019年2月28日5时3分,17,2019年2月28日5时3分,18,假设3:在一般功能模块中相互作用的编码蛋白质的疾病基因应该趋向于在相同的组织中表达。 为了衡量,我们引入疾病的组织同质系数。定义为: 其中 表示对于疾病i的关联基因至少在一个组织中表达的基因数目, 表示在组织j中 表达的基因的数目。 如右图,有68%的疾病有

9、完全组织同质性,随机情 况下为51%。(P10(-5),2019年2月28日5时3分,19,最后,参与一个功能模块的基因应该显示较高的表达谱相关。通过与随机控制的比较,发现关联相同疾病的基因对的Pearson相关系数(PCCs)有较高的值。一个给定疾病的所有基因对的PCC的平均值也存在显著性。大约33种疾病的平均PCC0.6。,2019年2月28日5时3分,20,总结:关联同一疾病的基因 1)他们对应的产物通过蛋白质相互作用倾向于彼此连接; 2)倾向于在特异性组织中共同表达; 3)显示较高的共表达水平; 4)作为一个组显示同步表达; 5)倾向于共享GO术语。 这些支持了对于疾病基因和他们产物的

10、全局功 能相关性,提供了一个疾病组的基于网络的模 型,2019年2月28日5时3分,21,中心性和外围性 一个细胞网络的结构和它功能特性的关联的最早的解释是在酿酒酵母中高连通蛋白或hubs更倾向于被关键基因编码。这促使研究者对人类疾病基因倾向于编码hubs的假设进行研究,但有研究者发现,二者仅有很弱的相关性。 我们最初的研究是支持 这一假设的。但是,疾病 基因和hubs的关系在不同 疾病基因间是不相同的。,2019年2月28日5时3分,22,在探索疾病基因是否编码hubs时,忽略了在早期发育中的关键基因,它们的改变导致高比例的自发流产。通过对老鼠基因的人类同源基因分析,发现1276个人类基因的

11、老鼠重要同源基因,其中398个与人类疾病有关,占人类疾病基因的22%。这样就把人类基因分为:1276个关键基因和1379个非关键疾病基因。 发现关键蛋白显示了同hubs关联的趋势,而其余非关键疾病蛋白没有这种趋势。,2019年2月28日5时3分,23,2019年2月28日5时3分,24,期望:关键基因和疾病基因的表达模式同相当数量的其他基因同步。 定义关键基因(或非关键疾病基因)i和细胞中所有其他基因之间的平均基因共表达系数 , 是从人类正常组织中计算得到的。 发现:对于关键基因,有高的的基因比小的或负的的基因更关键;而对于非关键疾病基因正好相反。,2019年2月28日5时3分,25,最后,我

12、们问:看家基因是否有一个编码疾病基因的趋势? 我们发现一个基因在越多的组织中表达,则这个基因是关键基因的可能性越高。而非关键疾病基因有在很少的组织中表达的趋势。 发现9.9%的看家基因对应到疾病基因,13.5%的非看家基因;,2019年2月28日5时3分,26,大部分疾病基因的次要性可以用进化的观点进行解释。 导致严重表型的体细胞突变更可能影响中心功能。我们分别研究了体细胞癌基因的特性,发现它们更可能编码hubs、显示了与其他基因更高的共表达性、更可能代表看家基因。体细胞癌基因的这种功能和拓扑中心性与当前的理解相吻合很多癌基因在细胞的发育和生长中发挥很重要的作用。,2019年2月28日5时3分

13、,27,在人类的复杂表型中探索遗传重叠,某些疾病会在病人中高频率(低频)的同时发生。因此研究疾病间的遗传重叠至关重要。 我们用对多种疾病的观察的大量的表型数据集和适当的统计模型,推理表型间的遗传重叠。 比方说,孤独症、双相型障碍和精神分裂症存在重要的遗传重叠。 因此,这种疾病网络假说可以很快被用在遗传图谱的方法设计上,它涉及看似孤立的多种表型间的联合关联,2019年2月28日5时3分,28,数据来源:哥伦比亚大学医学中心的临床资料库。包括161种疾病的150万病人记录。这些数据包含了疾病的比较宽的范围,从一般到稀有,影响不同的生理系统。,2019年2月28日5时3分,29,方法: 考虑一对疾病

14、D1和D2,模拟一个人在特定年龄或之前的表型。一个人天生带有(没有)疾病易感变化集合,用k1、k2和k12的随机变量表示,这些变量确定了某个人在某个时间被诊断为某种病的概率。 如果没有时间的调节,早发疾病和晚发疾病可能被错误的判断为负关联。,2019年2月28日5时3分,30,2019年2月28日5时3分,31,假设 1)如果有两种(多种)不同疾病是在相同环境下发生的,那么它们通常是通过分子机制引发的。 2)对于每个表型对D1和D2,整个人类基因组被分为四个不相交的核苷酸位点集合。 3)涉及连接疾病表型的四个 集合中遗传变异的假设机制。 在位点的疾病易感集合中,遗 传变异的数目越大,疾病表型

15、越可能显现出来。,2019年2月28日5时3分,32,这儿考虑两类遗传外显率函数:sharp-threshold和soft-threshold。 Sharp-threshold是指当多态性的数目超过阈值 时,表现出表型i的特征来。 是指表现疾病表型i所需要的,在疾病特异性核苷酸位点的有害多态性的最少数目。 Soft-threshold是指,阈值是一个随机变量,满足均值为 ,方差为 的二项分布。( ),2019年2月28日5时3分,33,对每一个疾病对,我们选择三种模型中的一种进行分析:二者不相关(也就是没有遗传重叠);二者负相关(竞争遗传重叠);二者正相关(合作遗传重叠)。 合作模型比标准的遗

16、传多效模型更一般。因为合作模型除了分享的多态性,还允许关联影响各自的遗传多态性。 独立模型是两个重叠模型的特殊情况,我们通过将两个重叠模型同独立模型比较,用两个对数似然比统计 代表我们分析的结果。 进一步,我们的参数模型提供了对假定遗传重叠的大小的评估。,2019年2月28日5时3分,34,相关性和重叠 对于遗传重叠的分析显示了疾病间的大量的相关性,很多都被很好的确定,但有些相关性先前没有描述过。 与孤独症的遗传重叠的疾病分为四类;双相型障碍和精神分裂症也类似分析。 这三种疾病同其余158中疾病的关联,红线代表正相关,蓝线代表负相关。,2019年2月28日5时3分,35,2019年2月28日5时3分,36,非孟德尔疾病的表型经常定义一个模糊度,尤其是神经学上的。很多情况下,观察到的疾病是有相似症状但可能不同遗传原因的多种病态的混合。 我们对一对疾病间遗传疾病的解释不排除一个疾病是另一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号