蛋白质相互作用网络课件

上传人:pu****.1 文档编号:567446901 上传时间:2024-07-20 格式:PPT 页数:71 大小:754KB
返回 下载 相关 举报
蛋白质相互作用网络课件_第1页
第1页 / 共71页
蛋白质相互作用网络课件_第2页
第2页 / 共71页
蛋白质相互作用网络课件_第3页
第3页 / 共71页
蛋白质相互作用网络课件_第4页
第4页 / 共71页
蛋白质相互作用网络课件_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《蛋白质相互作用网络课件》由会员分享,可在线阅读,更多相关《蛋白质相互作用网络课件(71页珍藏版)》请在金锄头文库上搜索。

1、第九章第九章 蛋白质相互作用网络蛋白质相互作用网络比较基因组学与生物信息学实验室比较基因组学与生物信息学实验室上节课回顾:上节课回顾:生物网络特征生物网络特征n生物分子网络具生物分子网络具有稀疏性有稀疏性n生物分子网络具生物分子网络具scale-free性质性质n生物分子网络具有生物分子网络具有超小世界性超小世界性n生物分子网络具生物分子网络具有层次结构有层次结构n生物分子网络具有生物分子网络具有度的负关联性度的负关联性n生物分子网络具有一定的生物分子网络具有一定的鲁棒性和适应性鲁棒性和适应性1.1.生物分子网络具有稀疏性生物分子网络具有稀疏性n生物网络的生物网络的稀疏性的实质:稀疏性的实质:

2、 是是生物在长期进化过程中达到某种生物在长期进化过程中达到某种优化的表现结果优化的表现结果。2.生物分子网络具有生物分子网络具有scale-free性质性质n无标度网络的无标度网络的显著特点:显著特点:n多数节点有少量连接,多数节点有少量连接,n少数节点有大量连接少数节点有大量连接。n这种这种特性表明特性表明:n生物分子网络拥有生物分子网络拥有动态过程动态过程,n少数节点所代表的少数节点所代表的生物分子起到关键作用生物分子起到关键作用。n细胞的细胞的新陈代谢新陈代谢有着有着无标度的拓扑属性;无标度的拓扑属性;在在代谢反应代谢反应中:中:n多数的代谢酶解物仅参与了多数的代谢酶解物仅参与了1个或个

3、或2个反应个反应,n而少数几个酶解物则参与了而少数几个酶解物则参与了众多反应众多反应,发挥着,发挥着代谢代谢中枢中枢的作用。的作用。3.生物分子网络具有超小世界性生物分子网络具有超小世界性n小世界网络:小世界网络:n是指有短的平均路径长度是指有短的平均路径长度n较大的平均聚类系数的网络。较大的平均聚类系数的网络。n在细胞内新陈代谢的研究中:在细胞内新陈代谢的研究中:n均通过均通过3或或4个反应的路径就能够连接多数成对的代个反应的路径就能够连接多数成对的代谢物谢物,n短的路径长度表明,短的路径长度表明,对代谢物浓度的局域扰动能够对代谢物浓度的局域扰动能够迅速地遍及整个网络迅速地遍及整个网络。n由

4、此可见,具有由此可见,具有超小世界效应的网络超小世界效应的网络n更便于更便于生物信息在网络的节点生物信息在网络的节点之间得到迅速传播。之间得到迅速传播。4.生物分子网络具有层次结构生物分子网络具有层次结构n生物分子网络大致上分成四个层次:生物分子网络大致上分成四个层次:n节点节点n模体模体n功能模块功能模块n网络网络n功能模块:功能模块:n是对生物分子网络中协同运作实现是对生物分子网络中协同运作实现相对独立生物功相对独立生物功能能的一组节点的一组节点n模块在生物分子网络普遍存在模块在生物分子网络普遍存在5. 生物分子网络具有度的负关联性生物分子网络具有度的负关联性n度的负关联性;度的负关联性;

5、n具有具有度大的节点趋向于连接度小的节点的特度大的节点趋向于连接度小的节点的特点点n在蛋白质相互作用的网络中:在蛋白质相互作用的网络中:n度度非常大非常大的蛋白质节点的蛋白质节点不直接相连不直接相连n与与度比较小度比较小的蛋白质节点的蛋白质节点相连接相连接6.生物分子网络具有一定的鲁棒性和适应性生物分子网络具有一定的鲁棒性和适应性n生物分子网络具有生物分子网络具有鲁棒性鲁棒性:n即对于外界环境的变化或者内部个体之间的不相容即对于外界环境的变化或者内部个体之间的不相容有着一定的有着一定的承受能力承受能力,这与生物分子,这与生物分子网络无标度的网络无标度的拓扑性质拓扑性质息息相关。拥有息息相关。拥

6、有不同度值的节点不同度值的节点对移除表对移除表型的型的影响差异很大影响差异很大。当移除网络中的多数。当移除网络中的多数非关键节非关键节点基因时点基因时,几乎没有明显的表型影响。,几乎没有明显的表型影响。n生物分子网络也具有生物分子网络也具有适应性适应性:n当外界环境发生变化时,也表现出适应性,这些当外界环境发生变化时,也表现出适应性,这些性性质的产生机制质的产生机制都是目前研究的重点。都是目前研究的重点。9.1 蛋白质蛋白质功能功能n蛋白质(蛋白质(protein)是一种复杂的有机化合物,是一种复杂的有机化合物,也称也称“多肽多肽”,它由氨基酸分子排列的线性链,它由氨基酸分子排列的线性链所构成

7、,其氨基酸序列是由对应的基因序列所构成,其氨基酸序列是由对应的基因序列(遗传密码遗传密码)所确定。)所确定。n除了按照遗传密码所编码的十种标准氨基酸除了按照遗传密码所编码的十种标准氨基酸外,在某些生物体中,外,在某些生物体中,遗传密码还包括其他遗传密码还包括其他氨基酸。氨基酸。n蛋白质残基可以在被蛋白质残基可以在被翻译后修饰而发生化翻译后修饰而发生化学变化学变化,并改变其物理、化学及生物学性,并改变其物理、化学及生物学性能,从而能,从而改变蛋白质的功能改变蛋白质的功能。n多个蛋白质多个蛋白质可以组成复合体来实现某可以组成复合体来实现某一特一特定功能。定功能。n蛋白质的功能很多,例如以下几种最基

8、本蛋白质的功能很多,例如以下几种最基本的生理功能:的生理功能:n1.组成和修复生物体组成和修复生物体n2.调节生物体的生理机能调节生物体的生理机能n3.运输载体运输载体n4.供给能量供给能量n1.组成和修复生物体组成和修复生物体n蛋白质蛋白质是生物体细胞的基本构成物质。是生物体细胞的基本构成物质。n人体的肌肉、内脏、皮肤、大脑、毛发、血人体的肌肉、内脏、皮肤、大脑、毛发、血液及骨骼等的液及骨骼等的主要成分都是蛋白质。主要成分都是蛋白质。n蛋白质还可以帮助蛋白质还可以帮助伤口血液伤口血液凝固并促进其愈凝固并促进其愈合。合。n2.调节生物体的调节生物体的生理机能生理机能 构成生物体差不多所有的生命

9、活性物质,例构成生物体差不多所有的生命活性物质,例如:如:n催化催化体内各种生物化学反应的酶体内各种生物化学反应的酶n调节机体生长、发育并行使正常生理调节机体生长、发育并行使正常生理功能的功能的激素激素n抵御外来细菌抵御外来细菌和病毒的抗体及免疫类物质,和病毒的抗体及免疫类物质,当蛋白质充足时,一旦需要这些抗体和免疫当蛋白质充足时,一旦需要这些抗体和免疫物质在数小时内就可以增加数百倍。物质在数小时内就可以增加数百倍。n参与细胞的信号转导参与细胞的信号转导,调控细胞的发育和凋,调控细胞的发育和凋亡,及至生物体的命运。亡,及至生物体的命运。n形成生物体的渗透压,引发生物体的形成生物体的渗透压,引发

10、生物体的各种活各种活动动,例如肌肉的做功等。,例如肌肉的做功等。n3.运输载体运输载体n蛋白质是生物体内很多重要的代谢物和营养素的蛋白质是生物体内很多重要的代谢物和营养素的载载体体。n氧、脂类、维生素、矿物质与微量元素都需要利用氧、脂类、维生素、矿物质与微量元素都需要利用各种蛋白质运输到生物体需要的地方。各种蛋白质运输到生物体需要的地方。n例如,血红蛋白质可以输送氧;脂蛋白可以输送脂例如,血红蛋白质可以输送氧;脂蛋白可以输送脂肪。肪。n蛋白质还可以充满营养物质储备蛋白质还可以充满营养物质储备,例如植物种子中,例如植物种子中的大量蛋白质,就是在萌发时用的储备。的大量蛋白质,就是在萌发时用的储备。

11、n4.供给能量供给能量n由于蛋白质中含碳、氢、氧元素,当机体由于蛋白质中含碳、氢、氧元素,当机体需要时,可以被代谢系统分解,释放出能需要时,可以被代谢系统分解,释放出能量。量。n综上所述,综上所述,蛋白质参与了生命的几乎所有蛋白质参与了生命的几乎所有过程,过程,例如遗传、发育、繁殖、物质和能例如遗传、发育、繁殖、物质和能量的代谢、应激等。量的代谢、应激等。n揭示生物体内成千上万种蛋白质的具体功揭示生物体内成千上万种蛋白质的具体功能及其实施功能的机制,是在能及其实施功能的机制,是在21世纪世纪后基后基因组时代蛋白质研究的核心内容因组时代蛋白质研究的核心内容,也是当,也是当前生物科学极富挑战性的前

12、生物科学极富挑战性的研究领域之一研究领域之一。9. 2 蛋白质组学蛋白质组学n蛋白质组学(蛋白质组学(Proteomics)主要是大规模主要是大规模地研究蛋白质的结构和功能。地研究蛋白质的结构和功能。n定义:定义:在一定时间内一个细胞或一类细胞在一定时间内一个细胞或一类细胞中存在的所有蛋白质被称为蛋白质组中存在的所有蛋白质被称为蛋白质组(proteome),意指),意指proteins expressed by a genome,即一个细胞或一个组织的,即一个细胞或一个组织的“基因基因组所表达的全部蛋白质组所表达的全部蛋白质”。n蛋白质组学是应用各种技术研究蛋白质组蛋白质组学是应用各种技术研究

13、蛋白质组的一门的一门新兴科学新兴科学。n其目的是从其目的是从整体的角度整体的角度分析细胞内分析细胞内动态变动态变化的蛋白质组分化的蛋白质组分、表达水平与修饰状态,表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。蛋白质功能与细胞生命活动规律。9. 3 蛋白质相互作用网络蛋白质相互作用网络n蛋白质的相互作用蛋白质的相互作用(PPI, Protein-protein interaction)是指蛋是指蛋白质分子之间的相关性,白质分子之间的相关性,并从生物化学、信号转导和遗传网络的角并从生物化学、信号转导和遗传网络的角度研究这种

14、相关性。度研究这种相关性。n将此内容看作是一个将此内容看作是一个“蛋白质相互作用网络蛋白质相互作用网络”(PPIN)的尝试性定义。)的尝试性定义。Protein interaction:two or more proteins (same or different) interact or form complex 人类蛋白质组相互作用人类蛋白质组相互作用 有一些蛋白质可以以有一些蛋白质可以以单体单体的形式发挥的形式发挥作用,但是大部分的蛋白质都是和作用,但是大部分的蛋白质都是和伴侣分子伴侣分子或是与或是与其他蛋白质其他蛋白质一起发一起发挥作用的。挥作用的。蛋白质相关知识及研究蛋白质相蛋白质相

15、关知识及研究蛋白质相互作用的必要性互作用的必要性 基因组计划基因组计划-大量的新基因不断被发现,然而单纯的大量的新基因不断被发现,然而单纯的基因组基因组DNA序列尚不能解答许多生命问题。序列尚不能解答许多生命问题。基因基因是相对是相对静静态态的,而基因编码的产物的,而基因编码的产物蛋白质蛋白质则是则是动态动态的,具有时空的,具有时空性和调节性,是生物功能的主要体现者和执行者。性和调节性,是生物功能的主要体现者和执行者。蛋白质蛋白质的表达水平、存在方式以及相互作用等直接与生物功能相的表达水平、存在方式以及相互作用等直接与生物功能相关。关。 在所有生命活动中,在所有生命活动中,蛋白质之间的相互作用

16、蛋白质之间的相互作用是必不可是必不可少的,它是细胞进行一切代谢活动的少的,它是细胞进行一切代谢活动的基础基础。细胞接受外源细胞接受外源或是内源的信号,通过其特有的信号途径,调节其基因的或是内源的信号,通过其特有的信号途径,调节其基因的表达,以保持其生物学特性。表达,以保持其生物学特性。在这个过程中,蛋白质占有在这个过程中,蛋白质占有很重要的地位,它可以调控很重要的地位,它可以调控, 介导细胞的许多生物学活性。介导细胞的许多生物学活性。 为了更好地理解细胞的生物学活为了更好地理解细胞的生物学活性,必须很好地理解性,必须很好地理解蛋白质单体蛋白质单体和和复复合物合物的功能,这就会涉及到的功能,这就

17、会涉及到蛋白质相蛋白质相互作用互作用的研究。因此,揭示蛋白质之的研究。因此,揭示蛋白质之间的相互作用关系、建立间的相互作用关系、建立相互作用关相互作用关系的网络图系的网络图,已成为蛋白质组学研究,已成为蛋白质组学研究中的热点中的热点,也是后基因时代的难题所在。也是后基因时代的难题所在。研究蛋白质相互作用的方法也就具有研究蛋白质相互作用的方法也就具有更为重要的意义。更为重要的意义。蛋白质相互作用:蛋白质相互作用:1.通过对蛋白质相互作用的研究,认识生命通过对蛋白质相互作用的研究,认识生命活动的基本规律。(科学)活动的基本规律。(科学)2.利用蛋白质相互作用,发展技术,用于研利用蛋白质相互作用,发

18、展技术,用于研究生命活动的规律或应用性技术。(技术究生命活动的规律或应用性技术。(技术)nPPIN在许多生物过程和研究防治疾病中发挥在许多生物过程和研究防治疾病中发挥着非常重要的作用。着非常重要的作用。nPPIN的研究比基因网络更为的研究比基因网络更为复杂和困难复杂和困难。n蛋白质相互作用网络近年来蛋白质相互作用网络近年来明显发展较快明显发展较快。蛋白质相互作用关蛋白质相互作用关系的复杂性,超出系的复杂性,超出任何个人或特定机任何个人或特定机构的研究能力。构的研究能力。如何研究蛋白质相如何研究蛋白质相互作用?互作用?n考虑到考虑到PPIN的复杂性,研究人员往往从多的复杂性,研究人员往往从多种方

19、向和视角来研究某一生物所有的蛋白种方向和视角来研究某一生物所有的蛋白质相互作用。质相互作用。n而在研究而在研究PPIN的计算方法中面临着的计算方法中面临着许多挑许多挑战性问题。战性问题。运用生物信息学的方运用生物信息学的方法由繁入简。研究的法由繁入简。研究的广度广度实验分析的方法由实验分析的方法由简入繁。研究的深简入繁。研究的深度度研究蛋白质相互作用的表象与其生物学意义的关系和研究蛋白质相互作用的表象与其生物学意义的关系和其中的规律其中的规律蛋白质相互作用是一种表象,通过表象分析规律,是蛋白质相互作用是一种表象,通过表象分析规律,是研究蛋白质相互作用的核心研究蛋白质相互作用的核心从从“种瓜得瓜

20、,种豆得豆种瓜得瓜,种豆得豆”到孟德尔遗传定律到孟德尔遗传定律现象现象 科学问题科学问题 研究方法和技术研究方法和技术酵母蛋白质相互作用联络图酵母蛋白质相互作用联络图 人蛋白质相互作用联络图人蛋白质相互作用联络图如此复杂的相互作用,哪些是有相关功能的?哪些如此复杂的相互作用,哪些是有相关功能的?哪些是是“噪音噪音”?整体整体系统系统部分部分单体单体 在研究在研究PPIN的计算方法中面临着的计算方法中面临着许多许多挑战性问题。挑战性问题。na:为全面了解某一生物功能的机理,研究:为全面了解某一生物功能的机理,研究并确定并确定PPIN中两个节点之间相互作用的边中两个节点之间相互作用的边是需要是需要

21、解决的第一个重要问题解决的第一个重要问题,这被称为,这被称为小规模实验小规模实验。nb:研究研究PPIN的拓扑的拓扑结构和规模结构和规模,对于了,对于了解该网络的解该网络的全局性能全局性能是非常重要的。是非常重要的。nc:研究:研究PPIN中中蛋白质复合体蛋白质复合体是至关重要的。一些蛋白质可是至关重要的。一些蛋白质可与其他多个蛋白质结合组成蛋与其他多个蛋白质结合组成蛋白质复合体。通常这些复合体白质复合体。通常这些复合体可以可以组成一个稳定的单位组成一个稳定的单位,在,在一定时间内不会发生重大变化。一定时间内不会发生重大变化。但也有另一些但也有另一些高度动态变化的高度动态变化的复合体复合体可导

22、致细胞状态和功能可导致细胞状态和功能的改变。的改变。nc:蛋白质复合体的形态可:蛋白质复合体的形态可转化转化为其他不同为其他不同形态,由此可以构造一种形态,由此可以构造一种蛋白质复合体形蛋白质复合体形态演化网络。态演化网络。nd:生物体内的:生物体内的信号转导信号转导路径、代谢路径和有关的路径、代谢路径和有关的细胞过程是构建细胞过程是构建PPIN的骨的骨干干。要了解细胞,研究和。要了解细胞,研究和建立上述路径模型也是至建立上述路径模型也是至关重要的。在许多信号转关重要的。在许多信号转导和代谢路径中都有导和代谢路径中都有蛋白蛋白质相互作用。质相互作用。ne:可根据蛋白质相互:可根据蛋白质相互作用

23、的关系作用的关系来预测蛋来预测蛋白质的白质的功能功能。预测蛋白质功能是目前计算。预测蛋白质功能是目前计算生物学的一个最重要的任务。利用数据模生物学的一个最重要的任务。利用数据模型和计算方法,可以直接从型和计算方法,可以直接从蛋白质序列预蛋白质序列预测测PPIN的结构、功能及其动力学机制。的结构、功能及其动力学机制。n例如,例如,基于假设邻近基于假设邻近蛋白质具有相似性的蛋白质具有相似性的聚类方法,聚类方法,统计统计“投票投票”方法方法,全局预测全局预测方法方法,表达谱分析的最短距离方法表达谱分析的最短距离方法,概率概率方法,马尔可夫随机场方法方法,马尔可夫随机场方法和和信息传递方信息传递方法法

24、等各种方法。等各种方法。9. 4 蛋白质相互作用网络中的模体和模块蛋白质相互作用网络中的模体和模块n生物中的一个有趣现象是生物中的一个有趣现象是直系同源直系同源(orthologous)蛋白质可以在物种的进化)蛋白质可以在物种的进化过程中保留生物功能。过程中保留生物功能。n因此,这些因此,这些直系同源蛋白质直系同源蛋白质所组成的模体所组成的模体可以很好地揭示这些蛋白质在特定生物功可以很好地揭示这些蛋白质在特定生物功能中的能中的作用和重要性作用和重要性。n为揭示蛋白质的进化率和它所在的模体之间的关为揭示蛋白质的进化率和它所在的模体之间的关系,研究者对酿酒酵母的蛋白质相互作用网络进系,研究者对酿酒

25、酵母的蛋白质相互作用网络进行了分析。行了分析。n分别识别了其中的分别识别了其中的两节点、三节点和四节点两节点、三节点和四节点的所的所组成的模体。组成的模体。n认为如果由于认为如果由于进化压力进化压力来维持来维持特定模体特定模体的话,模的话,模体中的组成蛋白应该是体中的组成蛋白应该是进化保守进化保守的并且在其他物的并且在其他物种中具有种中具有直系同源性直系同源性。n他们研究了他们研究了678个蛋白质个蛋白质,且在五个其他物,且在五个其他物种中都分别具有一个直系同源蛋白。种中都分别具有一个直系同源蛋白。n五个物种:五个物种:拟南芥、果蝇、小鼠、线虫和拟南芥、果蝇、小鼠、线虫和人。人。n分析结果发现

26、,分析结果发现,不同的模体中的蛋白质具有不同不同的模体中的蛋白质具有不同的保守率。的保守率。n只有不只有不到到5%的三节点的三节点组成的线性模体其组成蛋白组成的线性模体其组成蛋白质在五个物种中是质在五个物种中是完全保守的完全保守的,而,而47%的五节的五节点点组成的组成的完全连通的模体完全连通的模体在五个物种中是在五个物种中是完全保守完全保守的的。这些结果说明直系同源蛋白在酵母蛋白质相。这些结果说明直系同源蛋白在酵母蛋白质相互作用网络中互作用网络中不是随机分布的,而是保守模体的不是随机分布的,而是保守模体的基本组成使得这些模体是进化保守的。基本组成使得这些模体是进化保守的。n研究还发现,研究还

27、发现,大的模体更倾向于进化保守大的模体更倾向于进化保守。n这些模体中的蛋白质在其他物种中都具有这些模体中的蛋白质在其他物种中都具有直直接同源蛋白接同源蛋白。n也就是说,对于同一模体,其也就是说,对于同一模体,其包含的节点包含的节点和连接越多,其组成蛋白质越保守。和连接越多,其组成蛋白质越保守。n第三列:给出了第三列:给出了模体在酵母蛋白质模体在酵母蛋白质中相互作用中中相互作用中的个数;的个数;n第四列:给出了在五个物种完全保守的模体所占第四列:给出了在五个物种完全保守的模体所占原第三列给出原第三列给出模体个数的比例模体个数的比例;n第五列:给出了第五列:给出了随机分布随机分布的直系同源蛋白质中

28、所的直系同源蛋白质中所找到的模体找到的模体占第三列给出模体个数的比例占第三列给出模体个数的比例;n第六列:给出的是第六列:给出的是第四列和第五列之比第四列和第五列之比,如果该,如果该值越高说明了该模体越是高度保守的。值越高说明了该模体越是高度保守的。n另外,为研究模体中组成另外,为研究模体中组成蛋白的功能蛋白的功能对其进化保对其进化保守的影响,守的影响,研究者将模体和生物功能通过模体的研究者将模体和生物功能通过模体的组成蛋白质连接起来。组成蛋白质连接起来。n分析发现,分析发现,大的模体具有很明显增加的功能一致大的模体具有很明显增加的功能一致性。性。例如,例如,95%的全连通的五节点模体,其所有

29、的全连通的五节点模体,其所有的组成蛋白至的组成蛋白至少共享一个生物功能少共享一个生物功能; 相反,相反,10%的两节点模体是功能一致的。的两节点模体是功能一致的。n对应酵母的不同生物功能,研究者在人的基因组对应酵母的不同生物功能,研究者在人的基因组中找到了完全进化保守的模体的中找到了完全进化保守的模体的类型和数目类型和数目。n对于一些特殊的生物功能,像亚细胞位置、蛋白对于一些特殊的生物功能,像亚细胞位置、蛋白质命运和转录,质命运和转录,11个个所研究模体中的每一个都是所研究模体中的每一个都是非常保守的非常保守的。相反,其他一些生物功能,像转运、。相反,其他一些生物功能,像转运、调控和细胞运输,

30、只有一个或者两个保守的模体。调控和细胞运输,只有一个或者两个保守的模体。n这些结果说明,这些结果说明,不同的生物功能不仅和模体的特不同的生物功能不仅和模体的特定拓扑特征有关,而且还和这些模体的不同进化定拓扑特征有关,而且还和这些模体的不同进化速率有关。速率有关。n网络中的模体还有助于识别生物网络中的网络中的模体还有助于识别生物网络中的重要重要功能模块功能模块。n分析发现,分析发现,全连接的模体全连接的模体很有可能是属于很有可能是属于某个蛋白质复合物的。某个蛋白质复合物的。9.5 估算人类蛋白质相互作用的规模估算人类蛋白质相互作用的规模n在果蝇、线虫和人类基因组计划完成后,在果蝇、线虫和人类基因

31、组计划完成后,科学界发现科学界发现基因数量基因数量并不能反映生物的复并不能反映生物的复杂性。杂性。n2008年,英国伦敦帝国理工学院分子生物年,英国伦敦帝国理工学院分子生物科学系及数学科学研究所的科学系及数学科学研究所的斯顿夫斯顿夫 (Michael P.H. Stumpf)等发表论文指出,等发表论文指出,PPIN网络的网络的规模与各种生物组织的复杂性规模与各种生物组织的复杂性有很大关系。有很大关系。n他们提出了一种稳定、功能强大而且简单他们提出了一种稳定、功能强大而且简单的统计学方法,可根据的统计学方法,可根据子网的数据来估算子网的数据来估算整个网络的规模。整个网络的规模。n根据现已获得的人

32、类蛋白质相互作用的大根据现已获得的人类蛋白质相互作用的大量数据,量数据,Stumpf利用此方法估算出人类利用此方法估算出人类PPIN的规模的规模约为约为65万万,它大约,它大约比线虫大比线虫大3倍,倍,比果蝇大一个数量级比果蝇大一个数量级。n生物体的复杂性不仅反映在生物体的复杂性不仅反映在基因数量上,基因数量上,还与其各种还与其各种相互作用数量相互作用数量有关。有关。n例如,可变剪接变异、翻译后加工等均是例如,可变剪接变异、翻译后加工等均是影响生物体复杂性的重要因素。影响生物体复杂性的重要因素。n现在现在特别缺乏特别缺乏人类等各种生物体的人类等各种生物体的PPIN的的数据。数据。n目前,这些数

33、据可利用各种实验技术及利目前,这些数据可利用各种实验技术及利用计算机模拟推理等方法产生,但是这些用计算机模拟推理等方法产生,但是这些数据具有数据具有两个局限性两个局限性:n1.容易出现容易出现假阳性假阳性(false positive)和和假阴性假阴性(false negative);n2.基于高度理想化和简单的基于高度理想化和简单的网络结构网络结构。n一些研究者利用现有的实验技术对酵母的一些研究者利用现有的实验技术对酵母的PPIN进行了较全面深入的研究。进行了较全面深入的研究。n赖古伊赖古伊 (Reguly)等发现酵母的等发现酵母的PPIN数据数据几几乎完全没有假阳性乎完全没有假阳性,然而大

34、多数其他生物,然而大多数其他生物体的体的PPIN数据仍然非常缺乏。数据仍然非常缺乏。n以往的研究表明,一般来说子网络与整个以往的研究表明,一般来说子网络与整个网络有本质上的不同特性。网络有本质上的不同特性。n然而最近有越来越多的人开始认识到然而最近有越来越多的人开始认识到网络取样网络取样及及系统生物学系统生物学数据数据的重要性。的重要性。nStumpf的研究表明,可以从的研究表明,可以从子网络的数据推断整子网络的数据推断整个网络个网络的一些性能。还可以用这种方法及图论等的一些性能。还可以用这种方法及图论等其他方法,根据现有的蛋白质相互作用数据来其他方法,根据现有的蛋白质相互作用数据来估估算整个

35、算整个PPIN的规模的规模,将来甚至能够估计各种生物,将来甚至能够估计各种生物体相互作用组的规模。体相互作用组的规模。9.5. 估算相互作用网络的规模估算相互作用网络的规模nStumpf提出了利用子网络的数据估算整个提出了利用子网络的数据估算整个相互作用网络规模的新方法,并进行了相互作用网络规模的新方法,并进行了大大量的模拟。量的模拟。n对于某一特定特种的估算,使用了不同的对于某一特定特种的估算,使用了不同的独立数据集合,这些数据集合是利用不同独立数据集合,这些数据集合是利用不同的方法产生,例如的方法产生,例如酵母双杂交和串联亲和酵母双杂交和串联亲和纯化(纯化(TAP)标记产量方法。标记产量方

36、法。Stumpf所估算的所估算的PPIN规模数据与实验规模数据与实验和模拟结果相当符合。和模拟结果相当符合。n设相互作用网络有设相互作用网络有N个节点和个节点和MN条边,条边,Vn和和EN分别是其节点和边的集合。该网络可分别是其节点和边的集合。该网络可以用下式表示:以用下式表示:n设有设有Vn的节点子集的节点子集VS,由由VS构成的子网络构成的子网络GS可用下式表示:可用下式表示:n其中,在其中,在GS中的边集合中的边集合ES是是GN边的集合边的集合EN的子集合,这样就可以根据现有子网络的子集合,这样就可以根据现有子网络GS的数据来预测相互作用网络的数据来预测相互作用网络GN的规模。的规模。n

37、假设网络假设网络GN是根据由未知参数向量是根据由未知参数向量描述描述的特征模式产生的,的特征模式产生的,GS是从是从GN取样得到的取样得到的子子 网络,则抽样的似然概率可用下式计算:网络,则抽样的似然概率可用下式计算:n其中,假定抽样与网络的生成模式无关。其中,假定抽样与网络的生成模式无关。参数参数是指普遍性的抽样过程,不只是对独是指普遍性的抽样过程,不只是对独立节点抽样。立节点抽样。n另外,还假设有另外,还假设有N个节点的该网络规模的数个节点的该网络规模的数量级量级NN是已知的,并允许节点具有与网络是已知的,并允许节点具有与网络连线无关的附加信息(例如,蛋白质系列连线无关的附加信息(例如,蛋

38、白质系列的种类)。的种类)。n因此,只需要利用被因此,只需要利用被标记的标记的NN个节点来计个节点来计算整个网络算整个网络GN的总和的总和。9.6 蛋白质互作网络蛋白质互作网络n蛋白质互作通常可以分为蛋白质互作通常可以分为物理互作和遗传互作物理互作和遗传互作。物理互作是指蛋白间通过空间构象或化学键彼此物理互作是指蛋白间通过空间构象或化学键彼此发生的结合或化学反应,是蛋白质互作的主要研发生的结合或化学反应,是蛋白质互作的主要研究对象究对象。n而遗传互作则是指而遗传互作则是指在特殊环境下,蛋白或其编码在特殊环境下,蛋白或其编码基因受到其他蛋白质或基因影响,常常表现为表基因受到其他蛋白质或基因影响,

39、常常表现为表型变化之间的相互关系型变化之间的相互关系。(一)蛋白质互作检测技术(一)蛋白质互作检测技术n早期的蛋白质互作检测工作主要早期的蛋白质互作检测工作主要基于免疫共沉淀基于免疫共沉淀技术技术(co-immunoprecipitation)。近些年来,)。近些年来,一些高通量的检测技术应用于检测蛋白质间的相一些高通量的检测技术应用于检测蛋白质间的相互作用关系(蛋白质互作)。互作用关系(蛋白质互作)。n其中较为常用的技术有其中较为常用的技术有酵母双杂交(酵母双杂交(Yeast Two Hybrid,Y2H)技术和串联亲和纯化技术和串联亲和纯化-质谱分析质谱分析(Tandem Affinity

40、 Purification - Mass Spectrometry,TAP-MS)技术。)技术。n1.免疫共沉淀技术免疫共沉淀技术n2.酵母双杂交技术酵母双杂交技术n3.串联亲和纯化串联亲和纯化-质谱分析技术质谱分析技术 n4.蛋白质互作预测技术蛋白质互作预测技术 n5.遗传互作检测技术遗传互作检测技术 (二)蛋白质互作数据库(二)蛋白质互作数据库n目前,已经有大量蛋白质互作数据信息存目前,已经有大量蛋白质互作数据信息存储在的公共数据库中,提供了大量的蛋白储在的公共数据库中,提供了大量的蛋白质相互作用信息,其中包括质相互作用信息,其中包括BIND数据库、数据库、DIP数据库、数据库、MIPS数

41、据库和数据库和GRID数据库数据库等等等。从这些数据库中,可以得到不同物种等。从这些数据库中,可以得到不同物种的蛋白质互作信息及其实验证据。的蛋白质互作信息及其实验证据。DatabaseIntrodutionBIND:http:/bind.ca/。生物分子对象网络数据库(生物分子对象网络数据库(Biomolecular Object Network Databank)中最重要的组成部分之一。主要记录蛋白质互作在内的)中最重要的组成部分之一。主要记录蛋白质互作在内的生物分子间的相互作用信息,并将其中的信息分为经过人工检查的生物分子间的相互作用信息,并将其中的信息分为经过人工检查的可信信息和高通量

42、数据信息。用户可以通过网络工具查询互作信息可信信息和高通量数据信息。用户可以通过网络工具查询互作信息也可以将互作信息下载到本地进行处理也可以将互作信息下载到本地进行处理.DIP:http:/dip.doembi.ucla.edu/。专门存储蛋白质相互作用信息的数据库。该数据库中也包含人工检专门存储蛋白质相互作用信息的数据库。该数据库中也包含人工检查的可靠信息和自动计算方法所获取的高通量数据。该数据库可以查的可靠信息和自动计算方法所获取的高通量数据。该数据库可以按照不同的物种选择下载不同格式的蛋白质互作信息。用户可以通按照不同的物种选择下载不同格式的蛋白质互作信息。用户可以通过网络工具查询互作信

43、息也可以将互作信息下载到本地进行处理过网络工具查询互作信息也可以将互作信息下载到本地进行处理MIPS:http:/www.helmholtz-muenchen.de/en/mips/跨物种的综合性数据库,包含多种数据库信息。其中的跨物种的综合性数据库,包含多种数据库信息。其中的CYGD数据数据库提供了比较完整酵母蛋白质互作信息。而库提供了比较完整酵母蛋白质互作信息。而MIPS哺乳动物数据库哺乳动物数据库MPPI则提供了经过人工检查的哺乳动物蛋白质互作信息。用户可则提供了经过人工检查的哺乳动物蛋白质互作信息。用户可以通过网络工具查询互作信息也可以将互作信息下载到本地进行处以通过网络工具查询互作信

44、息也可以将互作信息下载到本地进行处理理BioGrid:http:/www.thebiogrid.org/。一个包含多物种蛋白质互作信息的数据库。数据库中包含来自多个一个包含多物种蛋白质互作信息的数据库。数据库中包含来自多个物种的互作信息,其中即包括物理互作信息也包括遗传互作信息。物种的互作信息,其中即包括物理互作信息也包括遗传互作信息。用户可以通过网络工具查询互作信息也可以将互作信息下载到本地用户可以通过网络工具查询互作信息也可以将互作信息下载到本地进行处理。该数据库的网址为:进行处理。该数据库的网址为:(二)蛋白质互作数据库(二)蛋白质互作数据库n蛋白质互作网络是系统显示蛋白质互作信息的基本方蛋白质互作网络是系统显示蛋白质互作信息的基本方法。将法。将蛋白作为节点蛋白作为节点,相互作用关系作为边,将,相互作用关系作为边,将蛋白蛋白质组整体质组整体连接到一个系统网络当中,一般情况下,蛋连接到一个系统网络当中,一般情况下,蛋白质互作网络是一个规模较大的白质互作网络是一个规模较大的无向网络无向网络。n蛋白质互作网络也往往是蛋白质互作网络也往往是规模最大规模最大的生物分子网络,的生物分子网络,常常包含数千甚至上万个节点以及为数常常包含数千甚至上万个节点以及为数更多的边更多的边。n目前蛋白质互作网络是被研究最充分的生物分子网络目前蛋白质互作网络是被研究最充分的生物分子网络之一之一.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号