计算系统生物学导论4蛋白质组学.

上传人:没有****飞上 文档编号:260545452 上传时间:2022-02-28 格式:PPT 页数:69 大小:5.14MB
返回 下载 相关 举报
计算系统生物学导论4蛋白质组学._第1页
第1页 / 共69页
计算系统生物学导论4蛋白质组学._第2页
第2页 / 共69页
计算系统生物学导论4蛋白质组学._第3页
第3页 / 共69页
计算系统生物学导论4蛋白质组学._第4页
第4页 / 共69页
计算系统生物学导论4蛋白质组学._第5页
第5页 / 共69页
点击查看更多>>
资源描述

《计算系统生物学导论4蛋白质组学.》由会员分享,可在线阅读,更多相关《计算系统生物学导论4蛋白质组学.(69页珍藏版)》请在金锄头文库上搜索。

1、TheIntroductionofComputationalSystemsBiology计算系统生物学导论WangDongAssociateProfessor蛋白质组学proteinRNADNA蛋白质相互网络 蛋白质相互作用网络 蛋白质网络可以被表示成为一个无向图,其中每个节点表示一个蛋白质,每条边表示一对蛋白质节点之间的相互作用。模块性(Modularity)蛋白质网络拓扑特征 蛋白质相互作用网络特点: 网络直径与特征路径长度 度的分布特性及度与度的相关性 聚集系数(cluster coefficient) 间隔, 等等 拓扑特征 小世界特性 聚集系数和特征路径长度 无尺度网络特性 幂规律分

2、布;增长和偏好连接 向心特性 模块化结构特征 蛋白质网络无尺度的意义lHub节点主导着网络l大量低连接度节点的意义呢?hub节点在网络中的作用和网络的鲁棒性从因特网路由器中随机选择的失效节点比例高达80%,剩余的路由器还是能组成一个完整的模块并保证任意两个节点间存在通路。要扰乱细抱内的蛋白质相互作用网络也同样困难,即使在细胞内随机制造较高比例的突变,那些没有改变的蛋白质还是会组成一个连通的网络。 无尺度网络对意外故障具有惊人的鲁棒性,但对于hub节点的过分依赖导致了攻击脆弱性 蛋白质网络怎么组织的?l这是我们最关心的问题l目前已知的知识:u小世界:表明蛋白质网络有一些很潇洒很随意的链接,导致网

3、络路径得到很大压缩。u无尺度:表明蛋白质网络有数目超过我们期望的很牛的节点,主导着整个网络。网络是怎么组织的到模块是怎么组织的?模块之间的协作怎么完成?神经生物学的类比Red: transcription regulation; Blue: cell-cycle/cell-fate control; Green: RNA processing; Yellow: protein transport. Protein complexes and functional modules in molecular networksSpirin, Mirny, PNAS 100, 12123 (2003)

4、modules that are densely connected within themselves but sparsely connected with the rest of the network从模块是怎么组织的?到模块在网络中是怎么组织的?蛋白质组相互作用数据库数据库名说明网址BIND生物分子相互作用数据库http:/bind.ca/DIP蛋白质相互作用数据库http:/dip.doe-mbi.ucla.edu/IntAct蛋白质相互作用数据库http:/www.ebi.ac.uk/intact/index.htmlInterDom结构域相互作用数据库http:/interdo

5、m.lit.org.sg/MINT生物分子相互作用数据库http:/mint.bio.uniroma2.it/mint/STRING蛋白质相互作用网络数据库http:/string.embl.de/HPRD人类蛋白质参考数据库http:/www.hprd.org/MPPI脯乳动物相互作用数据库http:/mips.gsf.de/proj/ppi/biogrid蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人http:/www.thebiogrid.org/PDZbase包含PDZ结构域的蛋白质相互作用数据库http:/icb.med.cornell.edu/services/pdz/st

6、artReactome生物学通路的辅助知识库http:/reactome.org/PPI databasesl InteractionsMIPSDIPBINDGRIDMINTHPRDOPHID数据库比较之数据量Suresh Mathivanan Anevaluationofhumanprotein-proteininteractiondatainthepublicdomain.BMCBioinformatics2006,7HPRD (Human Protein Reference Database)l 来自于文献而且有实验证据l 相关信息 post-translational modifica

7、tions, subcellular localization protein domain architecture, tissue expression Association with human diseasesl 除了蛋白质之间的相互作用 蛋白质与核酸的相互作用 蛋白质与小分子的相互作用l 数据格式PSI-MI Proteomics Standards Initiative Molecular Interactions http:/www.hprd.org/数据检索(HPRD)DIPl 人工从文献中获取的l 两两相互作用和复杂相互作用http:/dip.doe-mbi.ucla.ed

8、u/Experimental methodsl Tagged Fusion Proteinsl Coimmunoprecipitationl Yeast Two-hybridl Biacorel Atomic Force Microscopy (AFM)l Fluorescence Resonace Energy Trasfer (FRET)l X-ray Diffractionl Large-scale tandem affinity purification coupled to mass spectrometry (TAPMS)l fragment complementation ass

9、ay酵母双杂交系统l利用酵母作为真核蛋白相互作用的模型l通过报告基因的转录鉴定蛋白的相互作用酵母双杂交原理l 双杂交系统的建立得力于对真核生物调控转录起始过程的认识。 转录激活因子在结构上是组件式的(modular), 即这些因子往往由两个或两个以上相互独立的结构域构成, 其中有DNA结合结构域(DNA binding domain,简称为DB)和转录激活结构域(activation domain,简称为AD),它们是转录激活因子发挥功能所必需的。前者可识别DNA上的特异序列,并使转录激活结构域定位于所调节的基因的上游,转录激活结构域可同转录复合体的其他成分作用,启动它所调节的基因的转录。二个

10、结构域不但可在其连接区适当部位打开,仍具有各自的功能,而且不同两结构域可重建发挥转录激活作用。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白-蛋白的相互作用。单独的DB虽然能和启动子结合,但是不能激活转录。 His, -galDNA-BindingDomainBait ProteinPrey ProteinTranscriptionActivatingRegionReporter GeneDNA-Binding Site酵母双杂交模型模型系统生物学的基础信息l生物的信息以这样的方向进行流动:DNAmRNA蛋白质蛋白质相互作用网络细胞器官个体群体 l每个层次信息都对理解生命系统的运行提

11、供有用的视角。l系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。 l构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。l生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。寻找实验条件相关的蛋白质互作子网络 l 蛋白质间的互作有着其内在的动态性,互作的发生依赖于特定的实验条件。但是,由于目前互作鉴别技术内在的局限性,互作信息还不能提供互作发生对应的时空信息。换句话说,现有的互作信息是静态的信息,一组基因间的互作是多个实验条件下互作关系的一种累积。那么,依据互作信息构建的互作网络也是一个静

12、态的网络,它反映的是基因组内所有基因互作关系的叠加。因此,我们的目的是借助于基因表达谱提供的基因表达信息反映基因的活性然后对原始的互作网络进行筛选,从而得到实验条件下的应答子网 l实验条件下应答子网的鉴别将有助于研究生物体对环境改变的适应机制,更有效地构建分子通路,预测基因功能以及药物靶点的设计。l现有的寻找实验条件下特定网络的研究大多是基于节点打分方式和搜索方式,网络中的边则是节点涉及到的所有互作。 实验数据l 互作数据l 提取MIPS中的Physical interaction数据,经过如下操作:(1)去除自己和自己的互作;(2)不同实验证实的同一互作只保留一个.以基因为节点,以互作关系为

13、边构建互作网络,节点数目为4096,边数为6928。l 表达谱数据l 使用的是酵母diauxic shift实验数据。diauxic shift过程指的是:起初培养基内有着较丰富的葡萄糖,随着酵母的不断消耗(不进行补充),葡萄糖浓度由高变低,酵母的代谢过程由葡萄糖的无氧发酵转换为酒精的有氧呼吸的过程。表达谱数据经ArrayTool处理(删掉有缺失值的基因,因为只有7个时间点,即使有一个时间点的数据缺失,缺失率就会达到10%以上;标化采用的是减中值的方法),处理后一共有5349个基因。将表达谱数据与互作网络数据进行交叉结合(即将互作网络中没有检测的基因去除)得到网络G0,节点数为3282,边数为

14、5151。网络G0是寻找应答子网待搜索的网络。对子网的应答性打分 l一方面要衡量网络中基因的变异程度l一方面要衡量直接连通基因间的表达协同性。l网络中基因的变异程度越高,基因间表达协同性越大,则子网的应答性越强,我们的打分系统应该相应地给出较高的得分 l边的得分取决于两端的基因,基因的变异越大,基因间表达的一致性越强,则边的得分越高。我们使用了一个非常简单而且直接的测度协方差来定量这种关系。l 在子网内相连接两个基因X,Y间的协方差为: 基因X,Y的相关系数,反映了基因间表达的协同性; 基因X,Y的标准差,反映了基因的变异程度。 l 它是一种基于边的打分方式,分值的大小与三方面有关:网络内基因

15、的变异程度;连通基因间表达的协同性;网络的大小。另外打分过程较充分地考虑了网络的拓扑结构:l 1、用连通基因间的表达协同性反映网络的协同性;l 2、能够体现Hub节点的重要性:Hub节点指的是网络中度较高的节点,无论是在网络的拓扑结构上还是在生物过程上Hub节点都扮演着重要的角色。l 在我们的打分方案中,度越高的节点涉及的边越多,对网络的应答性得分影响越大 子网的搜索策略 l 从互作网络中寻找RNs,由于子网可能的形式有无穷多个,这是一个NP问题,不能通过穷举所有可能来寻找得分最高的子网。同M2方法一样采用模拟退火的搜索策略,该算法的优势是在搜索的过程中能够跳出局部最小点,并且数学上证明了只要

16、迭代的次数足够多,模拟退火算法能够搜索得到最优解。与M2方法不同之处是:我们进行搜索的对象是边,而不是节点,通过搜索得到的边集构建应答子网。 l搜索过程每次迭代试探的对象是边,试探将边加到应答子网或者将边从应答子网拿出是否能够提高分值,如果能提高则接受这次试探,如果分值降低则以一定的概率接受,随着退火温度的降低,接受的概率越来越小,最终通过边集构建得到应答网络。 应答子网中一些重要hub节点的功能相关性 l Hub节点指的网络中度(与该节点连接的边数)较高的节点,无论是对于细胞生物学过程还是网络的拓扑结构,hub节点都扮演着重要的作用。Han et al. 在以前的研究中提出了两种hub节点,一种是party hub,这种hub在特定的实验下同时与周围的partner发生互作;另一类是date hub,这类hub在一定的实验条件只与一部分相应的partner发生互作。以上结果支持了酵母体内蛋白质的模块化结构,即party hub位于模块的内部,而date hub是位于模块之间,因此party hub的功能一致性要高于date hub的功能一致性。在下面的分析中,我们会关注网络中的hub

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 教育/培训/课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号