《蛋白质结构》PPT课件

上传人:博****1 文档编号:584519081 上传时间:2024-08-31 格式:PPT 页数:140 大小:3.52MB
返回 下载 相关 举报
《蛋白质结构》PPT课件_第1页
第1页 / 共140页
《蛋白质结构》PPT课件_第2页
第2页 / 共140页
《蛋白质结构》PPT课件_第3页
第3页 / 共140页
《蛋白质结构》PPT课件_第4页
第4页 / 共140页
《蛋白质结构》PPT课件_第5页
第5页 / 共140页
点击查看更多>>
资源描述

《《蛋白质结构》PPT课件》由会员分享,可在线阅读,更多相关《《蛋白质结构》PPT课件(140页珍藏版)》请在金锄头文库上搜索。

1、蛋白质研究进展蛋白质研究进展目录目录 蛋白质结构蛋白质结构 Proteinstructure 蛋白质折叠蛋白质折叠 Proteinfolding 分子马达分子马达 Molecularmotor 蛋白质相互作用蛋白质相互作用 Protein-proteininteraction蛋白质剪接蛋白质剪接 Intein:ProteinSplicing 糖蛋白糖蛋白- -糖生物学糖生物学Glycoprotein-Glycobiology 蛋白质工程蛋白质工程 Proteinengineering蛋白质结构蛋白质结构Proteinstructure蛋白质结构蛋白质结构n蛋白质结构是结构生物学的蛋白质结构是结

2、构生物学的中心问中心问题题n 结构生物学是分子生物学的分支结构生物学是分子生物学的分支,特特 别是蛋白质和核酸的三维形状和功能别是蛋白质和核酸的三维形状和功能。n包括:包括: 蛋白质结构蛋白质结构分析分析 蛋白质结构信息学:蛋白质结构预测蛋白质结构信息学:蛋白质结构预测蛋白质大小蛋白质大小蛋白质是相对分子质量很大的生物分子。蛋白质是相对分子质量很大的生物分子。对一种给定的蛋白质来说对一种给定的蛋白质来说,氨基酸的组成和顺氨基酸的组成和顺序以及链的长度方面都应该是相同的,即均一序以及链的长度方面都应该是相同的,即均一的蛋白质。均一蛋白质的相对分子质量可以测的蛋白质。均一蛋白质的相对分子质量可以测

3、得得。蛋白质的相对分子质量其变化范围很大,从约蛋白质的相对分子质量其变化范围很大,从约6103到到1107或更大一些或更大一些目前估计蛋白质平均约目前估计蛋白质平均约300300残残基基。约。约5050残残基基似似乎乎是是执行特定的生化功能下限执行特定的生化功能下限蛋白质的相对分子质量蛋白质的相对分子质量的单位:的单位:Kd与与S蛋白质蛋白质的氨基酸数的氨基酸数量的量的估计估计对不含辅基的简单蛋白质,用对不含辅基的简单蛋白质,用110110除它的除它的相对分子质量即该蛋白的氨基酸的数。相对分子质量即该蛋白的氨基酸的数。蛋白质蛋白质2020种氨基酸的平均相对分子质量种氨基酸的平均相对分子质量约为

4、约为138138,但多数蛋白质中较小的氨基酸,但多数蛋白质中较小的氨基酸占优势,因此平均相对分子质量接近占优势,因此平均相对分子质量接近128128。又因每形成一个肽键将除去一分子水(相又因每形成一个肽键将除去一分子水(相对分子质量对分子质量1818),所以氨基酸残基的平均),所以氨基酸残基的平均相对分子质量约为相对分子质量约为128-18=110128-18=110。三种蛋白质分子量的测定方法三种蛋白质分子量的测定方法沉降法:沉降法:又叫超速离心法,蛋白质溶液经高又叫超速离心法,蛋白质溶液经高速离心时速离心时,沉降速度与蛋白质颗粒大小成正沉降速度与蛋白质颗粒大小成正比,利用比,利用M=RTS

5、/D(1-V)求其分子量求其分子量M。凝胶过滤法:凝胶过滤法:又称分子排阻层析或分子筛层又称分子排阻层析或分子筛层析法,此法葡聚糖凝胶分子筛层析析法,此法葡聚糖凝胶分子筛层析,根据待根据待测样品的洗脱体积求其分子量。测样品的洗脱体积求其分子量。SDS聚丙烯酰胺凝胶电泳法:聚丙烯酰胺凝胶电泳法:蛋白质在蛋白质在SDS聚丙烯酰胺凝胶中电泳,根据蛋白质分子在聚丙烯酰胺凝胶中电泳,根据蛋白质分子在电泳中的相对迁移率和分子质量的对数成正电泳中的相对迁移率和分子质量的对数成正比关系,可以求出蛋白质分子量比关系,可以求出蛋白质分子量。 葡聚糖凝胶测定蛋白质分子量葡聚糖凝胶测定蛋白质分子量 VeV0KdVi(

6、0Kd1)在一定的凝胶柱内,凝胶孔隙所占的体积成为内在一定的凝胶柱内,凝胶孔隙所占的体积成为内水体积水体积Vi,凝胶颗粒间的自由空间所占的体积称,凝胶颗粒间的自由空间所占的体积称为外水体积为外水体积V0。Kd为分配系数为分配系数。如果假定蛋白质分子近于球形,当蛋白质分子量如果假定蛋白质分子近于球形,当蛋白质分子量在在1000015000时,蛋白质在葡聚糖凝胶柱上层时,蛋白质在葡聚糖凝胶柱上层析的洗脱体积和分子量的对数呈直线关系。若用析的洗脱体积和分子量的对数呈直线关系。若用已知分子量的标准蛋白质在一定型号葡聚糖凝胶已知分子量的标准蛋白质在一定型号葡聚糖凝胶柱上层析,精确测其洗脱体积,并以洗脱体

7、积柱上层析,精确测其洗脱体积,并以洗脱体积Ve对分子量对数对分子量对数logMW作图,可获得一条标准曲作图,可获得一条标准曲线线。三个不同大小分子洗脱曲线示意图三个不同大小分子洗脱曲线示意图Ve/V0对对logMW作图作图 lgMW=K-bm 将已知分子量的标准蛋白质在将已知分子量的标准蛋白质在SDS-PAGE SDS-PAGE 中的电泳迁移率对分子量的对数作图,即中的电泳迁移率对分子量的对数作图,即可得到一条标准曲线。只要测得未知分子可得到一条标准曲线。只要测得未知分子量的蛋白质在相同条件下的电泳迁移率,量的蛋白质在相同条件下的电泳迁移率,就能根据标准曲线求得其分子量。就能根据标准曲线求得其

8、分子量。SDS聚丙烯酰胺凝胶电泳聚丙烯酰胺凝胶电泳蛋白质分类蛋白质分类 蛋白质分为三个主要类别,这与典型的高蛋白质分为三个主要类别,这与典型的高级级结构结构相相关:关:球状蛋白质球状蛋白质 Globular proteinsGlobular proteins纤维状蛋白纤维状蛋白 Fibrous proteinsFibrous proteins膜蛋白膜蛋白 Membrane proteinsMembrane proteins纤维状蛋白纤维状蛋白Fibrous proteinsFibrous proteins or or scleroproteinsscleroproteins. .纤维蛋白是仅见

9、于动物的结缔组织,肌腱,骨纤维蛋白是仅见于动物的结缔组织,肌腱,骨基质和肌纤维基质和肌纤维 通常杆或线样形状通常杆或线样形状 惰性或贮存蛋白质惰性或贮存蛋白质 水不溶性水不溶性 氨基酸序列往往具有有限的残氨基酸序列往往具有有限的残基基与重复与重复纤维状蛋白纤维状蛋白a-Keratin-Keratin: -Sheet Proteins Triple Helix : Collagen纤维状蛋白质纤维状蛋白质极极具潜力的材料具潜力的材料结构赋予了这些结构蛋白质特定的机械强度,为此可结构赋予了这些结构蛋白质特定的机械强度,为此可结构赋予了这些结构蛋白质特定的机械强度,为此可结构赋予了这些结构蛋白质特定

10、的机械强度,为此可以作为特制的材料。在利用天然的纤维状蛋白质作为以作为特制的材料。在利用天然的纤维状蛋白质作为以作为特制的材料。在利用天然的纤维状蛋白质作为以作为特制的材料。在利用天然的纤维状蛋白质作为材料外,目前人们还利用这些重形成一种新的人工蛋材料外,目前人们还利用这些重形成一种新的人工蛋材料外,目前人们还利用这些重形成一种新的人工蛋材料外,目前人们还利用这些重形成一种新的人工蛋白质材料,称为白质材料,称为白质材料,称为白质材料,称为SELP47KSELP47K。这种新的蛋白质材料兼。这种新的蛋白质材料兼。这种新的蛋白质材料兼。这种新的蛋白质材料兼有丝蛋白和弹性蛋白的特点,而且具有有丝蛋白

11、和弹性蛋白的特点,而且具有有丝蛋白和弹性蛋白的特点,而且具有有丝蛋白和弹性蛋白的特点,而且具有RSPPRSPP的特点,的特点,的特点,的特点,可以自组装,成为纳米材料。可以自组装,成为纳米材料。可以自组装,成为纳米材料。可以自组装,成为纳米材料。SELP47KSELP47K除了高强度除了高强度除了高强度除了高强度外,还可形成亲水凝胶,作为细胞外基质。外,还可形成亲水凝胶,作为细胞外基质。外,还可形成亲水凝胶,作为细胞外基质。外,还可形成亲水凝胶,作为细胞外基质。 另有一种蛋白质另有一种蛋白质另有一种蛋白质另有一种蛋白质/ /肽纤维的构建是利用又一种蛋白质肽纤维的构建是利用又一种蛋白质肽纤维的构

12、建是利用又一种蛋白质肽纤维的构建是利用又一种蛋白质纤维的结构原理。新的蛋白质纤维有纤维的结构原理。新的蛋白质纤维有纤维的结构原理。新的蛋白质纤维有纤维的结构原理。新的蛋白质纤维有SAF-p1SAF-p1和和和和SAF-SAF-p2p2。 胱氨酸的生产胱氨酸的生产我国巳开发出利用鸡、鸭毛和猪蹄甲壳等下脚料提取胱氨酸工艺。我国巳开发出利用鸡、鸭毛和猪蹄甲壳等下脚料提取胱氨酸工艺。我国巳开发出利用鸡、鸭毛和猪蹄甲壳等下脚料提取胱氨酸工艺。我国巳开发出利用鸡、鸭毛和猪蹄甲壳等下脚料提取胱氨酸工艺。迄今为止,日本、美国等仍在进口我国提取法生产的胱氨酸,现迄今为止,日本、美国等仍在进口我国提取法生产的胱氨

13、酸,现迄今为止,日本、美国等仍在进口我国提取法生产的胱氨酸,现迄今为止,日本、美国等仍在进口我国提取法生产的胱氨酸,现我国仍为世界胱氨酸第一产销大国。我国仍为世界胱氨酸第一产销大国。我国仍为世界胱氨酸第一产销大国。我国仍为世界胱氨酸第一产销大国。国际市场上采用发酵法生产的胱氨酸实际上仍未成熟,难以与提国际市场上采用发酵法生产的胱氨酸实际上仍未成熟,难以与提国际市场上采用发酵法生产的胱氨酸实际上仍未成熟,难以与提国际市场上采用发酵法生产的胱氨酸实际上仍未成熟,难以与提取法生产的胱氨酸在成本上进行较量。这就是我国胱氨酸能在竞取法生产的胱氨酸在成本上进行较量。这就是我国胱氨酸能在竞取法生产的胱氨酸在

14、成本上进行较量。这就是我国胱氨酸能在竞取法生产的胱氨酸在成本上进行较量。这就是我国胱氨酸能在竞争异常激烈的国际市场上畅销不衰的主要原因。争异常激烈的国际市场上畅销不衰的主要原因。争异常激烈的国际市场上畅销不衰的主要原因。争异常激烈的国际市场上畅销不衰的主要原因。据了解,从据了解,从据了解,从据了解,从20042004年以来,国际市场上的从饲料级、食品级到药用年以来,国际市场上的从饲料级、食品级到药用年以来,国际市场上的从饲料级、食品级到药用年以来,国际市场上的从饲料级、食品级到药用级等各种规格的胱氨酸价格均有所上涨。级等各种规格的胱氨酸价格均有所上涨。级等各种规格的胱氨酸价格均有所上涨。级等各

15、种规格的胱氨酸价格均有所上涨。19991999年胱氨酸出口均价年胱氨酸出口均价年胱氨酸出口均价年胱氨酸出口均价每公斤每公斤每公斤每公斤70857085元人民币,元人民币,元人民币,元人民币,20042004年我国出口胱氨酸均价升至每公斤年我国出口胱氨酸均价升至每公斤年我国出口胱氨酸均价升至每公斤年我国出口胱氨酸均价升至每公斤近近近近100100元。元。元。元。20072007年上半年,我国仅食品级胱氨酸出口均价已超过年上半年,我国仅食品级胱氨酸出口均价已超过年上半年,我国仅食品级胱氨酸出口均价已超过年上半年,我国仅食品级胱氨酸出口均价已超过每公斤每公斤每公斤每公斤100100元,国内经销商每公

16、斤元,国内经销商每公斤元,国内经销商每公斤元,国内经销商每公斤107107元,符合美国药典或欧洲药元,符合美国药典或欧洲药元,符合美国药典或欧洲药元,符合美国药典或欧洲药典标准的药用级胱氨酸出口价更高达每公斤典标准的药用级胱氨酸出口价更高达每公斤典标准的药用级胱氨酸出口价更高达每公斤典标准的药用级胱氨酸出口价更高达每公斤320320元元元元。据有关部门估计,国际市场对胱氨酸和半胱氨酸原料药的需求量据有关部门估计,国际市场对胱氨酸和半胱氨酸原料药的需求量据有关部门估计,国际市场对胱氨酸和半胱氨酸原料药的需求量据有关部门估计,国际市场对胱氨酸和半胱氨酸原料药的需求量已超过已超过已超过已超过1200

17、012000吨,而我国出口量始终保持在吨,而我国出口量始终保持在吨,而我国出口量始终保持在吨,而我国出口量始终保持在3000400030004000吨。吨。吨。吨。近年来国内兴建的一批较大的羽绒制品厂提绒后剩下的鸭毛、近年来国内兴建的一批较大的羽绒制品厂提绒后剩下的鸭毛、近年来国内兴建的一批较大的羽绒制品厂提绒后剩下的鸭毛、近年来国内兴建的一批较大的羽绒制品厂提绒后剩下的鸭毛、 鹅鹅鹅鹅毛羽毛梗已被用于代替人发和猪毛作为生产胱氨酸的原料。毛羽毛梗已被用于代替人发和猪毛作为生产胱氨酸的原料。毛羽毛梗已被用于代替人发和猪毛作为生产胱氨酸的原料。毛羽毛梗已被用于代替人发和猪毛作为生产胱氨酸的原料。

18、球状蛋白质球状蛋白质|在水溶液中球样蛋白。在水溶液中球样蛋白。Globular proteins,Globular proteins, or or spheroproteinsspheroproteins |Thetermglobularproteinisquiteold(datingprobablyfromthe19thcentury) |现在鉴于成千上万的蛋白质结构,有时以更优现在鉴于成千上万的蛋白质结构,有时以更优雅的描述词汇雅的描述词汇 structuralmotif 。|分子极性分子极性:疏水疏水基基团团在在分子内部,而极分子内部,而极性性亲水亲水基基团团在在分子外部分子外部Glob

19、ularproteins膜蛋白膜蛋白 膜蛋白是细胞膜或细胞器的蛋白质分子膜蛋白是细胞膜或细胞器的蛋白质分子 膜蛋白可分为两组:膜蛋白可分为两组: integral membrane proteinintegral membrane protein peripheral membrane proteinperipheral membrane protein or or I Integral ntegral amphitropic amphitropic 膜蛋白膜蛋白 蛋白蛋白结构分类结构分类n对蛋白质结构进行分类的方法有多种,有多个对蛋白质结构进行分类的方法有多种,有多个结构数据库(包括结构数据

20、库(包括SCOPSCOP、CATHCATH和和FSSPFSSP)分别采)分别采用不同的方法进行结构分类。存放蛋白质结构用不同的方法进行结构分类。存放蛋白质结构的的PDBPDB数据库中就引用了数据库中就引用了SCOPSCOP的分类。的分类。n对于大多数已分类的蛋白质结构来说,对于大多数已分类的蛋白质结构来说,SCOPSCOP、CATHCATH和和FSSPFSSP的分类是相同的,但在一些结构中的分类是相同的,但在一些结构中还有所区别。还有所区别。仍存在一些分歧和矛盾。仍存在一些分歧和矛盾。 n n一级数据库一级数据库二级数据库二级数据库在一级数据库、实验数据和理论分析的基础在一级数据库、实验数据和

21、理论分析的基础上,针对不同的研究内容和需要,对生物学上,针对不同的研究内容和需要,对生物学知识和信息的进一步整理得到的数据库。知识和信息的进一步整理得到的数据库。人类基因组图谱库人类基因组图谱库 GDBGDB转录因子和结合位点库转录因子和结合位点库 TRANSFACTRANSFAC蛋白质序列功能位点数据库蛋白质序列功能位点数据库 PrositePrositeSWISSPROT1.日内瓦大学医学生物化学系和欧洲生物信息学研究所日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(合作维护(1986年);年);2.在在EMBL和和GenBank数据库上均建立了镜像站点数据库上均建立了镜

22、像站点;3.数据库包括了从数据库包括了从EMBL翻译而来的蛋白质序列翻译而来的蛋白质序列,这些,这些序列序列经过检验和注释;经过检验和注释;4.数据记录包括两部分:数据记录包括两部分:序列序列注释注释(结构域、功能位点、跨膜区域、二硫键位置、翻译结构域、功能位点、跨膜区域、二硫键位置、翻译后的修饰、突变体等后的修饰、突变体等)5.SWISS-PROT的网址:的网址:http:/cn.expasy.org/sprotPIR(proteininformationresource)由美国由美国NCBI翻译自翻译自GenBank的的DNA序列序列(1984年年);在在EMBL和和GenBank数据库上

23、均数据库上均建立了镜像站点;建立了镜像站点;数据依据注释的质量分为数据依据注释的质量分为4类。类。PIRPIR网址:网址:http:/www-nbrf.georgetown.edu/一个数据库记录一个数据库记录(entry)(entry)一般由两部分组成:一般由两部分组成:1. 1. 原始数据原始数据(data)(data)2. 2. 描述这些数据生物学信息的注释描述这些数据生物学信息的注释(annotation)(annotation)注释中包含的信息与相应的序列数据同样重要和注释中包含的信息与相应的序列数据同样重要和有应用价值有应用价值数据的完整性和注释工作量:数据的完整性和注释工作量:1

24、. 1. 序列数据广,序列注释不够完整序列数据广,序列注释不够完整2. 2. 库数据面窄,序列注释全面库数据面窄,序列注释全面数据库的动态更新:数据库的动态更新:1.1.不断增加不断增加2.2.不断修正不断修正蛋白质的结构层次蛋白质的结构层次n初级结构初级结构:一级结构一级结构(primary structure)(primary structure);n 高级结构高级结构: 二级结构(二级结构(secondary structuresecondary structure) 超二级结构(超二级结构(supersecondary structuresupersecondary structure

25、) 结构域(结构域(structural domainstructural domain) 三级结构(三级结构(tertiary structuretertiary structure) 四级结构(四级结构(quarternary structurequarternary structure) 初级结构初级结构n今天今天已已知约有知约有1010万蛋白质的氨基酸序列万蛋白质的氨基酸序列n两个主要的蛋白质测序方法:两个主要的蛋白质测序方法: Edman degradationEdman degradation reaction reaction Mass spectrometryMass spec

26、trometry n预测蛋白质序列预测蛋白质序列:从从DNA / RNADNA / RNA序列序列蛋白质序列分析策略蛋白质序列分析策略n 链链的分离纯化。的分离纯化。 n链内链内二硫二硫键键裂切割(如果是链间二硫裂切割(如果是链间二硫键键的联系,的联系,第第2 2步步在在第第1 1步之前)步之前) n 氨基酸组成氨基酸组成确定确定n N -N -末端和末端和C -C -末端氨基酸分析末端氨基酸分析n 用不同的切割程序产生不同和重叠多肽片段用不同的切割程序产生不同和重叠多肽片段n 短肽自动化程序测序短肽自动化程序测序n氨基酸序重叠片段列重建。氨基酸序重叠片段列重建。 n 二硫二硫键定键定位位组成

27、蛋白质的多肽链数目种类组成蛋白质的多肽链数目种类将肽链水解成片断将肽链水解成片断将肽链水解,胰蛋白酶将肽链水解,胰蛋白酶(LysArgLysArg), 胰凝乳蛋白酶胰凝乳蛋白酶(PheTyrTrpPheTyrTrp)溴化氰(溴化氰(MetMet)TheEdmandegradationreaction质谱分析质谱分析自约翰自约翰. .芬恩芬恩(JohnB.Fenn)(JohnB.Fenn)和田中耕一和田中耕一(Koichi.Tanaka)(Koichi.Tanaka)发明了对生物大分子进发明了对生物大分子进行确认和结构分析的方法及发明了对生行确认和结构分析的方法及发明了对生物大分子的质谱分析法以

28、来,随着生命物大分子的质谱分析法以来,随着生命科学及生物技术的迅速发展,生物质谱科学及生物技术的迅速发展,生物质谱目前已成为有机质谱中最活跃、最富生目前已成为有机质谱中最活跃、最富生命力的前沿研究领域之一命力的前沿研究领域之一。质谱分析质谱分析传统的传统的EdmanEdman降解技术获得氨基酸序列信息只能降解技术获得氨基酸序列信息只能逐个获取逐个获取, ,效率低效率低, ,不能适应高通量实验的需求不能适应高通量实验的需求; ; 质谱技术为快速准确地获取蛋白质的一级结构质谱技术为快速准确地获取蛋白质的一级结构信息提供了新的检测技术手段信息提供了新的检测技术手段。首先通过质谱首先通过质谱仪测量蛋白

29、质样品的质量信息仪测量蛋白质样品的质量信息, , 获得样本的质获得样本的质谱信息谱信息,然后据此进行计算分析和推理然后据此进行计算分析和推理, , 来获来获得蛋白质的一级结构信息得蛋白质的一级结构信息, , 该过程即蛋白质鉴该过程即蛋白质鉴定定(protein identification)(protein identification)质谱分析的特点质谱分析的特点 质谱分析用于蛋白质等生物活性分子的研究具质谱分析用于蛋白质等生物活性分子的研究具有如下优点:有如下优点:很高的灵敏度能为亚微克级试样提供信息很高的灵敏度能为亚微克级试样提供信息能最有效地与色谱联用能最有效地与色谱联用适于复杂体系中

30、痕量物质的鉴定或结构测定适于复杂体系中痕量物质的鉴定或结构测定同时具有准确性、易操作性、快速性及很好的同时具有准确性、易操作性、快速性及很好的普适性。普适性。 质谱分析的方法质谱分析的方法 用于生物大分子质谱分析的软电离技术:用于生物大分子质谱分析的软电离技术:1)1)电喷雾电离质谱;电喷雾电离质谱;(electrospray ionisation(electrospray ionisation(electrospray ionisation(electrospray ionisation,ESI)ESI)ESI)ESI)2)2)基质辅助激光解吸电离质谱;基质辅助激光解吸电离质谱;(matri

31、x assisted (matrix assisted (matrix assisted (matrix assisted laser desorption/ionizationlaser desorption/ionizationlaser desorption/ionizationlaser desorption/ionization,MALDI)MALDI)MALDI)MALDI)3)3)快原子轰击质谱快原子轰击质谱4)4)离子喷雾电离质谱离子喷雾电离质谱5)5)大气压电离质谱。大气压电离质谱。在这些软电离技术中在这些软电离技术中,前面前面种研究得最多,应用种研究得最多,应用也最广泛。也

32、最广泛。 蛋白质的质谱分析蛋白质的质谱分析 蛋自质是一条或多条肽链以特殊方式组合的蛋自质是一条或多条肽链以特殊方式组合的生物大分子,复杂结构主要包括以肽链为基生物大分子,复杂结构主要包括以肽链为基础的肽链线型序列础的肽链线型序列 称为称为一级结构及一级结构及由肽链卷由肽链卷曲折叠而曲折叠而形成三维结构形成三维结构。目前质谱主要测定蛋自质一级结构包括分子目前质谱主要测定蛋自质一级结构包括分子量、肽链氨基酸排序及多肽或二硫键数目和量、肽链氨基酸排序及多肽或二硫键数目和位置。位置。蛋白质的质谱分析原理蛋白质的质谱分析原理 以往质谱以往质谱( () )仅用于小分子挥发仅用于小分子挥发物质分析物质分析.

33、 .由于由于新的离子化技术的出现,如介质辅助的新的离子化技术的出现,如介质辅助的激光解析激光解析/ /离子化、电喷雾离子化,各种新的离子化、电喷雾离子化,各种新的质谱技术开始用于生物大分子的分析。质谱技术开始用于生物大分子的分析。其原理是:通过电离源将蛋白质分子转化为其原理是:通过电离源将蛋白质分子转化为气相离子,然后利用质谱分析仪的电场、磁气相离子,然后利用质谱分析仪的电场、磁场将具有特定质量与电荷比值场将具有特定质量与电荷比值( (/ /值值) )的蛋的蛋白质离子分离开来,经过离子检测器收集分白质离子分离开来,经过离子检测器收集分离的离子,确定离子的离的离子,确定离子的/ /值,分析鉴定未

34、值,分析鉴定未知蛋白质。知蛋白质。 蛋白质和肽的序列分析蛋白质和肽的序列分析近年来随着电喷雾电离质谱近年来随着电喷雾电离质谱(ESI)及基质辅助及基质辅助激光解吸质谱激光解吸质谱(MALDI)等质谱软电离技术的等质谱软电离技术的发展与完善,极性肽分子的分析成为可能,发展与完善,极性肽分子的分析成为可能,检测限下降到检测限下降到fmol级级可测定分子量范围则高达可测定分子量范围则高达100000Da目前基质辅助的激光解吸电离飞行时间质谱目前基质辅助的激光解吸电离飞行时间质谱法法(MALDITOFMS)已成为测定生物大分子已成为测定生物大分子尤其是蛋白质、多肽分子量和一级结构的有尤其是蛋白质、多肽

35、分子量和一级结构的有效工具,也是蛋白质组研究所必不可缺的关效工具,也是蛋白质组研究所必不可缺的关键技术之一键技术之一。蛋白质的质谱分析方式蛋白质的质谱分析方式 质谱用于肽和蛋白质的序列测定主要分为三种方法:质谱用于肽和蛋白质的序列测定主要分为三种方法:蛋白图谱蛋白图谱(proteinmapping)(proteinmapping),即用特异性的酶或化学,即用特异性的酶或化学方法将蛋白水解切成小片段,然后用质谱检测各产物方法将蛋白水解切成小片段,然后用质谱检测各产物肽分子量,将所得到的肽谱数据输入数据库。将蛋白肽分子量,将所得到的肽谱数据输入数据库。将蛋白质绘制质绘制“肽图肽图”,肽质量指纹谱肽

36、质量指纹谱(peptide mass (peptide mass fingerprinting, PMF)fingerprinting, PMF)第二种方法是利用待测分子在电离及飞行过程中产生第二种方法是利用待测分子在电离及飞行过程中产生的亚稳离子,通过分析相邻同组类型峰的质量差,识的亚稳离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基,其中亚稳离子碎裂包括别相应的氨基酸残基,其中亚稳离子碎裂包括“自身自身”碎裂及外界作用诱导碎裂碎裂及外界作用诱导碎裂. .第三种方法与第三种方法与EdmanEdman法相似,即用化学探针或酶解使蛋法相似,即用化学探针或酶解使蛋白或肽从端或端逐一降解下

37、氨基酸残基,形成相白或肽从端或端逐一降解下氨基酸残基,形成相互间差一个氨基酸残基的系列肽,名为梯状测序互间差一个氨基酸残基的系列肽,名为梯状测序(laddersequencing)(laddersequencing),经质谱检测,由相邻峰的质量,经质谱检测,由相邻峰的质量差知道相应氨基酸残基。差知道相应氨基酸残基。 质谱仪质谱仪质谱仪是使大量分子带上电荷质谱仪是使大量分子带上电荷( (离子离子), ), 并根据并根据不同离子的质量与电荷比的差异而导致它们在不同离子的质量与电荷比的差异而导致它们在电场或磁场中运动轨迹的不同而对这些离子进电场或磁场中运动轨迹的不同而对这些离子进行分离行分离, ,

38、进而测量这些离子的质荷比与强度进而测量这些离子的质荷比与强度, , 并记录下来获得质谱数据的一种仪器并记录下来获得质谱数据的一种仪器. . 它由三大部分串联而成它由三大部分串联而成:离子源离子源(ion source)(ion source)质量分析器质量分析器(mass analyzer)(mass analyzer)检测器检测器(detector)(detector)Mainstepsofmassspectrometer用质谱测定序列用质谱测定序列 串联质谱串联质谱Tandemmassspectrometryn串联质谱仪是能够多轮质谱。串联质谱仪是能够多轮质谱。 n第一个质量分析器可以分离

39、许多进入质谱仪第一个质量分析器可以分离许多进入质谱仪的的一一个多肽。个多肽。 n第二个质量分析器稳定肽离子碰撞时的气体,使第二个质量分析器稳定肽离子碰撞时的气体,使他们片段的碰撞诱导解离他们片段的碰撞诱导解离(CID) (CID) 。 n第三个质量分析器分离多肽产生的各种碎片。第三个质量分析器分离多肽产生的各种碎片。u有各种方法:碰撞诱导解离有各种方法:碰撞诱导解离(CID)(CID) ,电子捕获,电子捕获解离解离(ECD)(ECD) ,电子转移解离(,电子转移解离( ETD ETD ) ,红外多,红外多光子解离(光子解离( IRMPD IRMPD )和红外辐射解离)和红外辐射解离(BIRD)

40、(BIRD)Proteinmassspectrometryn串联质谱仪通常的两个主要电离方法:串联质谱仪通常的两个主要电离方法:electrospray ionizationelectrospray ionization (ESI) (ESI) matrix-assisted laser desorption/ionizationmatrix-assisted laser desorption/ionization (MALDI). (MALDI). n两种策略:两种策略:完整蛋白质首先离子化,然后完整蛋白质首先离子化,然后进进分析仪。这种分析仪。这种称为称为“自上而下自上而下”的策略。的策略

41、。 蛋白质用蛋白酶消化成较小的多肽和引入质谱蛋白质用蛋白酶消化成较小的多肽和引入质谱仪和确定。他的做法也被称为仪和确定。他的做法也被称为“自下而上自下而上”的的蛋白质。蛋白质。蛋白质研究蛋白质研究中的中的质谱技术质谱技术2002 2002 年诺贝尔化学奖年诺贝尔化学奖: MALDI MALDI 和和ESIESI技术的发明技术的发明基于质谱技术基于质谱技术在在计算蛋白质研究计算蛋白质研究中中主要包括主要包括: 蛋白质的身份鉴定蛋白质的身份鉴定 氨基酸序列信息分析氨基酸序列信息分析 翻译后修饰分析翻译后修饰分析 定量化信息定量化信息 提取生物标记物发现与疾病诊断建模等提取生物标记物发现与疾病诊断建

42、模等蛋白质组学蛋白质组学ProteomicsProteomics The word proteome The word proteome :protein andprotein and genomegenome蛋白质是生物体或系统蛋白质是生物体或系统的的整个蛋整个蛋白质,包括修白质,包括修饰饰的蛋白质。的蛋白质。术语术语“蛋白质组学蛋白质组学”来来自自基因组学类推。基因组学类推。蛋白质组学的研究内容蛋白质组学的研究内容1.1.1.1.蛋白质鉴定:可以利用一维电泳和二维电泳并结合蛋白质鉴定:可以利用一维电泳和二维电泳并结合蛋白质鉴定:可以利用一维电泳和二维电泳并结合蛋白质鉴定:可以利用一维电泳和

43、二维电泳并结合WesternWesternWesternWestern等技术,利用蛋白质芯片和抗体芯片及免疫等技术,利用蛋白质芯片和抗体芯片及免疫等技术,利用蛋白质芯片和抗体芯片及免疫等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。共沉淀等技术对蛋白质进行鉴定研究。共沉淀等技术对蛋白质进行鉴定研究。共沉淀等技术对蛋白质进行鉴定研究。 2.2.2.2.翻译后修饰:很多蛋白质要经历翻译后修饰如磷酸翻译后修饰:很多蛋白质要经历翻译后修饰如磷酸翻译后修饰:很多蛋白质要经历翻译后修饰如磷酸翻译后修饰:很多蛋白质要经历翻译后修饰如磷酸化,糖基化等。对蛋白质翻译后修饰的研究对阐明蛋化

44、,糖基化等。对蛋白质翻译后修饰的研究对阐明蛋化,糖基化等。对蛋白质翻译后修饰的研究对阐明蛋化,糖基化等。对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。白质的功能具有重要作用。白质的功能具有重要作用。白质的功能具有重要作用。 3.3.3.3.蛋白质功能确定:如分析酶活性和确定酶底物,配蛋白质功能确定:如分析酶活性和确定酶底物,配蛋白质功能确定:如分析酶活性和确定酶底物,配蛋白质功能确定:如分析酶活性和确定酶底物,配基基基基- - - -受体结合分析。可以利用基因敲除和反义技术分受体结合分析。可以利用基因敲除和反义技术分受体结合分析。可以利用基因敲除和反义技术分受体结合分析。可以利用基因

45、敲除和反义技术分析基因表达产物析基因表达产物析基因表达产物析基因表达产物- - - -蛋白质的功能。蛋白质的功能。蛋白质的功能。蛋白质的功能。蛋白质在细胞内的定位研究蛋白质在细胞内的定位研究蛋白质在细胞内的定位研究蛋白质在细胞内的定位研究,ClontechClontechClontechClontech的荧光蛋白表的荧光蛋白表的荧光蛋白表的荧光蛋白表达系统就是研究蛋白质在细胞内定位的一个很好的工达系统就是研究蛋白质在细胞内定位的一个很好的工达系统就是研究蛋白质在细胞内定位的一个很好的工达系统就是研究蛋白质在细胞内定位的一个很好的工具。具。具。具。 4.4.4.4.蛋人类白质组学的研究最主要蛋人

46、类白质组学的研究最主要蛋人类白质组学的研究最主要蛋人类白质组学的研究最主要是是是是促进分子医学的发促进分子医学的发促进分子医学的发促进分子医学的发展。如寻找药物的靶分子。展。如寻找药物的靶分子。展。如寻找药物的靶分子。展。如寻找药物的靶分子。蛋白质组学蛋白质组学蛋白质蛋白质分离分离 : :双向凝胶电泳双向凝胶电泳蛋白质鉴定和相对数量蛋白质鉴定和相对数量测定测定: :基质辅基质辅助激光解吸质谱助激光解吸质谱maldi-ms/msmaldi-ms/ms和电喷和电喷雾串联质谱雾串联质谱 esi-ms/ms esi-ms/ms 。Two-dimensionalgelelectrophoresisn分离

47、技术:双向凝胶电泳,为分离技术:双向凝胶电泳,为2-D或二维电泳或二维电泳 等电等电聚焦聚焦IsoelectricfocusingSDS-PAGEn分子生物学的分子生物学的ExPASyExPASy网网,日内瓦大学日内瓦大学(http:/expasy.hcuge.ch/http:/expasy.hcuge.ch/)提供了访问二)提供了访问二维聚丙烯酰胺凝胶电泳数据库维聚丙烯酰胺凝胶电泳数据库,命名命名 SWISS- SWISS-2D2D- -PAGEPAGE。这个数据库包含来自许多不同的细。这个数据库包含来自许多不同的细胞和组的蛋白质双向电泳凝胶信息。胞和组的蛋白质双向电泳凝胶信息。 等电等电聚

48、焦聚焦 SDS-PAGE双向凝胶电泳双向凝胶电泳为什么要进行样品制备为什么要进行样品制备目前双向电泳一般只能分辨到目前双向电泳一般只能分辨到1000-30001000-3000个蛋白个蛋白质点,而样品中的蛋白种类可达到质点,而样品中的蛋白种类可达到1010万种以上,万种以上,因此样品的制备是必须的因此样品的制备是必须的。样品制备需要不同步骤样品制备需要不同步骤,不同方法来配合不同方法来配合。首先需要明确实验的最终目的:是分离尽可能多首先需要明确实验的最终目的:是分离尽可能多的蛋白还是样品中某些感兴趣的蛋白。的蛋白还是样品中某些感兴趣的蛋白。蛋白的溶解的效果取决于裂解、破碎、沉淀、溶蛋白的溶解的

49、效果取决于裂解、破碎、沉淀、溶解过程以及去污剂的选择和各种溶液的组成解过程以及去污剂的选择和各种溶液的组成。如果是样品中部分感兴趣蛋白,可采取预分离的如果是样品中部分感兴趣蛋白,可采取预分离的方法,如来自细胞器蛋白,应先采取细胞器分离;方法,如来自细胞器蛋白,应先采取细胞器分离;如进行全蛋白质组分析,则可以分级制备。如进行全蛋白质组分析,则可以分级制备。样品制备的原则样品制备的原则应使所有待分析的蛋白样品全部处于溶解状态应使所有待分析的蛋白样品全部处于溶解状态(包括多数疏水性蛋白),且制备方法应具有(包括多数疏水性蛋白),且制备方法应具有可重现性。可重现性。防止样品在聚焦时发生蛋白的聚集和沉淀

50、。防止样品在聚焦时发生蛋白的聚集和沉淀。防止在样品制备过程中发生样品的抽提后化学防止在样品制备过程中发生样品的抽提后化学修饰(如酶性或化学性降解等)。修饰(如酶性或化学性降解等)。完全去除样品中的核酸和某些干扰蛋白。完全去除样品中的核酸和某些干扰蛋白。尽量去除起干扰作用的高丰度或无关蛋白,从尽量去除起干扰作用的高丰度或无关蛋白,从而保证待研究蛋白的可检测性而保证待研究蛋白的可检测性AXIMA-QITMALDI-QIT-TOFMassSpectroscopy)蛋白质构象蛋白质构象n n 二级结构二级结构 Secondary structureSecondary structuren三级结构三级结

51、构 Tertiary structure Tertiary structure n四级结构四级结构 Quaternary structureQuaternary structure蛋白质构象蛋白质构象蛋白质构象蛋白质构象测定测定蛋白质构象蛋白质构象预测预测蛋白质结构的测定方法蛋白质结构的测定方法高分辨率高分辨率:X X射线晶体学射线晶体学| |核磁共振核磁共振| |电子晶体学电子晶体学中分辨率中分辨率:低温电子显微镜低温电子显微镜Cryo-electron microscopyCryo-electron microscopy光纤衍射光纤衍射质谱质谱光谱光谱:核磁共振核磁共振| |圆二色圆二色|

52、 |荧光荧光| |各向异性荧光各向异性荧光平移扩散分析超平移扩散分析超离心离心排阻色谱排阻色谱流动双折射流动双折射介电弛豫化学介电弛豫化学:氢氘交换氢氘交换| |定点突变定点突变| |化学修饰化学修饰热力学热力学:平衡展开平衡展开蛋白质结构的测定蛋白质结构的测定蛋白质数据蛋白质数据库中库中大约大约9090的蛋白质结构的蛋白质结构由由X X射射线晶体学确定。大约线晶体学确定。大约9 9的蛋白质结构的蛋白质结构由由核磁核磁共振获得。共振获得。 低温电子显微镜低温电子显微镜Cryo-electronmicroscopy最最近已成为一种手段来确定蛋白质结构高分辨率近已成为一种手段来确定蛋白质结构高分辨

53、率(小于(小于5 5埃或埃或0.50.5纳米)纳米) ,在未来的十年是一,在未来的十年是一种高分辨率的工具。种高分辨率的工具。晶体晶体x射线射线an X-Ray Beam, a Crystal, and a Detector. an X-Ray Beam, a Crystal, and a Detector. WorkflowforsolvingthestructureofamoleculebyX-raycrystallography.Crystallization of Myoglobin.Myoglobin Crystal and X-Ray.Myoglobin Crystal and X

54、-Ray. (A)Crystalofmyoglobin.(A)Crystalofmyoglobin.(B)X-rayprecessionphotographofamyoglobincrystal.(B)X-rayprecessionphotographofamyoglobincrystal.Section of the Electron-Density Map of Myoglobin.Section of the Electron-Density Map of Myoglobin. Thissectionoftheelectron-densitymapshowsthehemeThissect

55、ionoftheelectron-densitymapshowsthehemegroup.Thepeakofthecenterofthissectioncorrespondsgroup.Thepeakofthecenterofthissectioncorrespondstothepositionoftheironatom.tothepositionoftheironatom.ResolutionAffectstheQualityofanImage.Theeffectofresolutiononthequalityofareconstructedimageisshownbyanopticalan

56、alogofx-raydiffraction:(A)aphotographoftheParthenon;(B)anopticaldiffractionpatternoftheParthenon;(CandD)imagesreconstructedfromthepatterninpartB.MoredatawereusedtoobtainimageDthanimageC,whichaccountsforthehigherqualityofimageD.蛋白质的晶体结构开始在蛋白质的晶体结构开始在蛋白质的晶体结构开始在蛋白质的晶体结构开始在19501950年代后期年代后期年代后期年代后期, ,因为

57、这成功因为这成功因为这成功因为这成功, ,超超超超过过过过39000x39000x射线晶体结构的蛋白质、核酸及其他的生物射线晶体结构的蛋白质、核酸及其他的生物射线晶体结构的蛋白质、核酸及其他的生物射线晶体结构的蛋白质、核酸及其他的生物分子巳测定分子巳测定分子巳测定分子巳测定myoglobin限制限制 小分子晶体通常少于小分子晶体通常少于100100原子不对称单位原子不对称单位; ;这种晶体结构通常好解决。这种晶体结构通常好解决。 生物大分子晶体在晶胞往往涉及成千上生物大分子晶体在晶胞往往涉及成千上万的原子。这种晶体结构一般的解决较差万的原子。这种晶体结构一般的解决较差(smeared out

58、smeared out )-原子和化学键显示电原子和化学键显示电子密度管,而不是孤立的原子。子密度管,而不是孤立的原子。 内在膜蛋白的结晶仍然具有挑战性。内在膜蛋白的结晶仍然具有挑战性。核磁共振光谱核磁共振光谱核核磁共振波谱用于获取蛋白质的结构和动态的磁共振波谱用于获取蛋白质的结构和动态的信息。信息。KurtWthrich开创,开创,2002年诺贝尔化学奖。年诺贝尔化学奖。核磁共振(核磁共振(NuclearMagneticResonanceNMR),即核磁共振成像(即核磁共振成像(NuclearMagneticResonanceImaging,NMRI),又称磁共振成像),又称磁共振成像(Ma

59、gneticResonanceImaging,MRI)NMR技术即核磁共振谱技术,是将核磁共振现技术即核磁共振谱技术,是将核磁共振现象应用于分子结构测定的一项技术。象应用于分子结构测定的一项技术。核磁共振谱与紫外光谱、红外光谱和质谱一起核磁共振谱与紫外光谱、红外光谱和质谱一起被称为被称为“四大名谱四大名谱”。核磁共振光谱学的基础核磁共振光谱学的基础One-Dimensional NMR Spectra.One-Dimensional NMR Spectra.(A) 1H-NMR spectrum of ethanol (CH3CH2OH) shows that the chemical shi

60、fts (A) 1H-NMR spectrum of ethanol (CH3CH2OH) shows that the chemical shifts for the hydrogen are clearly resolved. for the hydrogen are clearly resolved. (B) 1H-NMR spectrum from a 55 amino acid fragment of a protein with a role (B) 1H-NMR spectrum from a 55 amino acid fragment of a protein with a

61、role in RNA splicing shows a greater degree of complexity. A large number of in RNA splicing shows a greater degree of complexity. A large number of peaks are present and many overlap. peaks are present and many overlap. The Nuclear Overhauser Effect. The nuclear Overhauser effect (NOE) identifies p

62、airs of protons that are in close proximity. (A) Schematic representation of a polypeptide chain highlighting five particular protons. Protons 2 and 5 are in close proximity (4 apart), whereas other pairs are farther apart. (B) A highly simplified NOESY spectrum. The diagonal shows five peaks corres

63、ponding to the five protons in part A. The peaks above the diagonal and the symmetrically related one below reveal that proton 2 is close to proton 5. Detecting Short Proton-Proton Distances.Detecting Short Proton-Proton Distances. ANOESYspectrumfora55aminoaciddomainfromaproteinANOESYspectrumfora55a

64、minoaciddomainfromaproteinhavingaroleinRNAsplicing.Eachoff-diagonalpeakhavingaroleinRNAsplicing.Eachoff-diagonalpeakcorrespondstoashortproton-protonseparation.correspondstoashortproton-protonseparation.Thisspectrumrevealshundredsofsuchshortproton-protonThisspectrumrevealshundredsofsuchshortproton-pr

65、otondistances,whichcanbeusedtodeterminethethree-distances,whichcanbeusedtodeterminethethree-dimensionalstructureofthisdomain.dimensionalstructureofthisdomain.Structures Calculated on the Basis of NMR Structures Calculated on the Basis of NMR Constraints.Constraints.(A)NOESYobservationsshowthatproton

66、s(connectedby(A)NOESYobservationsshowthatprotons(connectedbydottedredlines)areclosetooneanotherinspace.dottedredlines)areclosetooneanotherinspace.(B)Athree-dimensionalstructurecalculatedwiththese(B)Athree-dimensionalstructurecalculatedwiththeseprotonpairsconstrainedtobeclosetogether.protonpairsconst

67、rainedtobeclosetogether.A Family of Structures.A Family of Structures. Asetof25structuresfora28aminoaciddomainfromazinc-finger-Asetof25structuresfora28aminoaciddomainfromazinc-finger-DNA-bindingprotein.TheredlinetracestheaveragecourseoftheDNA-bindingprotein.Theredlinetracestheaveragecourseoftheprote

68、inbackbone.Eachofthesestructuresisconsistentwithhundredsproteinbackbone.EachofthesestructuresisconsistentwithhundredsofconstraintsderivedfromNMRexperiments.ThedifferencesbetweenofconstraintsderivedfromNMRexperiments.Thedifferencesbetweentheindividualstructuresareduetoacombinationofimperfectionsinthe

69、individualstructuresareduetoacombinationofimperfectionsintheexperimentaldataandthedynamicnatureofproteinsinsolution.theexperimentaldataandthedynamicnatureofproteinsinsolution.900MHz,21.2900MHz,21.2T TNMRMagnetatHWB-NMR,BirminghamNMRMagnetatHWB-NMR,BirminghamCryo-electronmicroscopyElectroncryomicrosc

70、opy(cryo-EMorcryo-electronmicroscopy)是一种形式的电子显微是一种形式的电子显微学(学(EM),研究的样本是在研究的样本是在结晶结晶温度(一温度(一般液态氮)般液态氮)的的电子电子晶晶体体显微图是三维图像显微图是三维图像这种方法可能提供一种新的建立近天然蛋这种方法可能提供一种新的建立近天然蛋白质骨白质骨架或架或其他大分子模型的的解决方案。其他大分子模型的的解决方案。CryoEM是结构生物学的是结构生物学的发展发展nWenJiang,MatthewL.Baker,JoanitaJakana,PeterR.Weigele,JonathanKing&WahChiuB

71、ackbonestructureoftheinfectious15viruscapsidrevealedbyelectroncryomicroscopyNature451,1130-1134(28February2008)nauthors:nMarkeyCenterforStructuralBiology,DepartmentofBiologicalSciences,PurdueUniversity,WestLafayette,Indiana47907,USAnNationalCenterforMacromolecularImaging,VernaandMarrsMcLeanDepartmen

72、tofBiochemistryandMolecularBiology,BaylorCollegeofMedicine,Houston,Texas77030,USAnDepartmentofBiology,MassachusettsInstituteofTechnology,Cambridge,Massachusetts02139,USAInfectiousbacteriophageepsilon15蛋白质结构预测蛋白质结构预测背景知识背景知识生物细胞种有许多蛋白质生物细胞种有许多蛋白质,生物学界常常将蛋白生物学界常常将蛋白质的结构分为质的结构分为4 4级结构级结构。蛋白质的空间结构往往蛋白质的

73、空间结构往往决定了其功能,因此,如何揭示蛋白质的结构是决定了其功能,因此,如何揭示蛋白质的结构是非常重要的工作。非常重要的工作。经过多年努力,结构测定的方法得到了很好的发经过多年努力,结构测定的方法得到了很好的发展,常用的有核磁共振和展,常用的有核磁共振和X X光晶体衍射。光晶体衍射。然而由然而由于实验测定比较耗时和昂贵,某些不易结晶的蛋于实验测定比较耗时和昂贵,某些不易结晶的蛋白质不适用。相比之下,测定蛋白质氨基酸序列白质不适用。相比之下,测定蛋白质氨基酸序列则比较容易。因此如果能够从一级序列推断出空则比较容易。因此如果能够从一级序列推断出空间结构则是非常有意义的工作。间结构则是非常有意义的

74、工作。蛋白质结构预测蛋白质结构预测n蛋白质结构预测是生物信息学和理论化学一个蛋白质结构预测是生物信息学和理论化学一个最重要的目标最重要的目标n蛋白质结构预测是非常重要蛋白质结构预测是非常重要:医学(例如,在药物设计)医学(例如,在药物设计) 生物技术(如设计新的酶)生物技术(如设计新的酶) 预测三维结构的蛋白质及其氨基酸序列,有时预测三维结构的蛋白质及其氨基酸序列,有时甚至包括额外的有关资料。甚至包括额外的有关资料。 结构预测流程结构预测流程蛋白质序列相似性搜相似性搜索数据库索数据库蛋白质序列是蛋白质序列是否符合已知的否符合已知的3 3 D D结构结构? ?蛋白家族,结构域,聚类分析与与已知结

75、已知结构关系构关系? ?结构分析3 D比较建模预测三维结构有一个有一个预言结预言结构构?实验室的三维分析yesnonono蛋白质结构预测主要有两大类方法蛋白质结构预测主要有两大类方法n(1 1 1 1)理论分析方法)理论分析方法)理论分析方法)理论分析方法:通过理论计算(如分子力学、通过理论计算(如分子力学、通过理论计算(如分子力学、通过理论计算(如分子力学、分子动力学计算)进行结构预测。分子动力学计算)进行结构预测。分子动力学计算)进行结构预测。分子动力学计算)进行结构预测。n(2 2 2 2)统计的方法)统计的方法)统计的方法)统计的方法:对已知结构的蛋白质进行统计分对已知结构的蛋白质进行

76、统计分对已知结构的蛋白质进行统计分对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而根据映射模析,建立序列到结构的映射模型,进而根据映射模析,建立序列到结构的映射模型,进而根据映射模析,建立序列到结构的映射模型,进而根据映射模型直接从氨基酸序列对未知结构的蛋白质预测结构。型直接从氨基酸序列对未知结构的蛋白质预测结构。型直接从氨基酸序列对未知结构的蛋白质预测结构。型直接从氨基酸序列对未知结构的蛋白质预测结构。 n包括:包括:包括:包括:n经验性方法经验性方法经验性方法经验性方法n结构规律提取方法结构规律提取方法结构规律提取方法结构规律提取方法n同源模型化方法同源模型化方法同源模型化方

77、法同源模型化方法蛋白质结构预测蛋白质结构预测的统计的统计学学方法方法同源性(同源性(HomologyHomology)方法)方法从头计算(从头计算(Ab initioAb initio) 方法方法穿线法穿线法(Threading)(Threading)方法:方法:(折叠识别方法)(折叠识别方法)1 1、同源模型化方法、同源模型化方法主要思想:主要思想:对于一个未知结构的蛋白质,找到一个已知对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。板,为未知结构的蛋白质建立结构模型。依据:依据: 任何一对

78、蛋白质,如果两者的序列等同部分任何一对蛋白质,如果两者的序列等同部分超过超过30%30%,则它们具有相似的三维结构,即,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。和非折叠区域的一些细节部分有所不同。 同源模型化法同源模型化法的的步骤步骤设待预测三维结构的蛋白质为设待预测三维结构的蛋白质为U U(UnknownUnknown),),同源模型化方法建模的过程包括同源模型化方法建模的过程包括6 6个步骤:个步骤: (1 1)搜索结构模型的模板)搜索结构模型的模板(T)(T) (2 2)序列比对)序列比对

79、 (3 3)建立骨架)建立骨架 (4 4)构建目标蛋白质的侧链)构建目标蛋白质的侧链 (5 5)构建目标蛋白质的环区)构建目标蛋白质的环区 (6 6)优化模型)优化模型预测结果准确率预测结果准确率对对于于具具有有60%60%等等同同的的序序列列,用用上上述述方方法法所所建建立立的三维模型非常准确。的三维模型非常准确。若若序序列列的的等等同同部部分分超超过过60%60%,则则预预测测结结果果将将接接近于实验得到的测试结果。近于实验得到的测试结果。 一一般般如如果果序序列列的的等等同同部部分分大大于于30%30%,则则可可以以期望得到比较好的预测结果。期望得到比较好的预测结果。 Threading

80、方法(折叠识别方法)方法(折叠识别方法)Threading Threading 方法:首先取出一条模版和查询方法:首先取出一条模版和查询序列作序列比对序列作序列比对(Alignment)(Alignment),将模版蛋白质,将模版蛋白质与查询序列匹配上的残基的空间坐标赋给查与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。询序列上相应的残基。比对的过程是在设计的一个能量函数指导下比对的过程是在设计的一个能量函数指导下进行的。进行的。根据比对结果和得到的查询序列的空间坐标,根据比对结果和得到的查询序列的空间坐标,通过设计的能量函数,得到一个能量值。通过设计的能量函数,得到一个能量值。将这

81、个操作应用到所有的模版上,取能量值将这个操作应用到所有的模版上,取能量值最低的那条模版产生的查询序列的空间坐标最低的那条模版产生的查询序列的空间坐标为我们的预测结果。为我们的预测结果。 Threading方法(折叠识别方法)方法(折叠识别方法)建立序列到结构的线索的过程称为线索化,线建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。索技术又称折叠识别技术。线索化或者折叠识别的目标是为目标蛋白质线索化或者折叠识别的目标是为目标蛋白质U U寻找合适的蛋白质模板,这些模板蛋白质与寻找合适的蛋白质模板,这些模板蛋白质与U U没没有显著的序列相似性,但却是有显著的序列相似性,但却是远程同源

82、远程同源的。的。 有有很很多多蛋蛋白白质质具具有有相相似似的的空空间间结结构构,但但它它们们的的序列等同部分小于序列等同部分小于25%25%,即,即远程同源远程同源。 对对于于这这类类蛋蛋白白质质,很很难难通通过过序序列列比比对对找找出出它它们之间的关系,必须设计新的分析方法。们之间的关系,必须设计新的分析方法。线索化的主要思想:线索化的主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。是否能够适配到一个给定的结构环境中。 3

83、3、从头预测方法、从头预测方法在既没有已知结构的同源蛋白质、也没有已在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,这时只知结构的远程同源蛋白质的情况下,这时只能采用从头预测方法。能采用从头预测方法。从头预测方法依据是热力学理论,即求蛋白从头预测方法依据是热力学理论,即求蛋白质能量最小的状态。生物学家和物理学家等质能量最小的状态。生物学家和物理学家等认为从原理上讲这是影响蛋白质结构的本质认为从原理上讲这是影响蛋白质结构的本质因素。然而由于巨大的计算量,这种方法目因素。然而由于巨大的计算量,这种方法目前只能计算几个氨基酸形成的结构。前只能计算几个氨基酸形成的结构。IBM I

84、BM 开开发的发的Blue Gene Blue Gene 超级计算机,就是要解决这超级计算机,就是要解决这个问题。个问题。从头预测法从头预测法的的3个组成部分个组成部分(1 1)一种蛋白质几何的表示方法)一种蛋白质几何的表示方法由于表示和处理所有原子和溶剂环境的计由于表示和处理所有原子和溶剂环境的计算开销非常大,因此需要对蛋白质和溶剂算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理。的表示形式作近似处理。(2 2)一种势函数及其参数)一种势函数及其参数通过对已知结构的蛋白质进行统计分析确通过对已知结构的蛋白质进行统计分析确定势函数中的各个参数定势函数中的各个参数(3 3)一种构象空间搜

85、索技术)一种构象空间搜索技术 构象空间搜索和势函数的建立是从头预测构象空间搜索和势函数的建立是从头预测方法的关键方法的关键从头预测方法从头预测方法分子动力学分子动力学蒙特卡罗方法蒙特卡罗方法模拟退火方法模拟退火方法遗传算法遗传算法预测方法评价预测方法评价对各种方法所得到的蛋白质结构预测结果需对各种方法所得到的蛋白质结构预测结果需要进行验证,以确定预测方法是否可行,确定要进行验证,以确定预测方法是否可行,确定其适应面。其适应面。验证的方法是取已知结构的蛋白质,对这些验证的方法是取已知结构的蛋白质,对这些蛋白质进行模拟结构预测,并将预测结构与真蛋白质进行模拟结构预测,并将预测结构与真实结构进行比较

86、,分析两者之间的差距。实结构进行比较,分析两者之间的差距。权威的评判机构,建立公共认可的蛋白质结权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在马里兰生物技术研究中构测试数据集。设立在马里兰生物技术研究中心的心的CASP就是这样一个系统就是这样一个系统(http:/predictioncenter.llnl.gov/casp4/)蛋白质二级结构预测蛋白质二级结构预测 蛋白质序列蛋白质序列蛋白质序列蛋白质序列 二级结构二级结构二级结构二级结构二级结构预测概述二级结构预测概述二级结构预测的基本依据是:每一段相邻的氨二级结构预测的基本依据是:每一段相邻的氨基酸残基具有形成一定二级结构的倾向

87、。基酸残基具有形成一定二级结构的倾向。二级结构预测问题是模式分类问题二级结构预测问题是模式分类问题二级结构预测的目标:判断每一段中心的残基二级结构预测的目标:判断每一段中心的残基是否处于是否处于 螺旋、螺旋、 折叠、转角(或其它状态)折叠、转角(或其它状态)之一的二级结构态,即三态。之一的二级结构态,即三态。 基本策略(基本策略(1 1)相似序列相似序列相似结构相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK结构?结构?基本策略(基本策略(2 2)- -分类分析分类分析螺旋螺旋提取样本提取样本聚类分析聚类分析学习分类规则学习分类规则预测预测.-Gly-Ala-Glu-Ph

88、e-.二级结构预测方法二级结构预测方法基于单个氨基酸残基统计分析基于单个氨基酸残基统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。以此作为二级结构预测的依据。基于氨基酸片段的统计分析基于氨基酸片段的统计分析统计的对象是氨基酸片段统计的对象是氨基酸片段片段的长度通常为片段的长度通常为11-2111-21片段体现了中心残基所处的环境片段体现了中心残基所处的环境在预测中心残基的二级结构时,以残基在特定环境形成特在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据定二级结构的倾向作为预

89、测依据 二级结构预测二级结构预测算法算法(1)Chou-Fasman算法算法(2)GOR算法:,因其作者算法:,因其作者Garnier,Osguthorpe和和Robson而得名而得名(3)多序列列线预测)多序列列线预测(4)基于神经网络的序列)基于神经网络的序列(Back-PropagationNetwork)(5)基于已有知识的预测方法()基于已有知识的预测方法(knowledgebasedmethod):(6)混合方法()混合方法(hybridsystemmethod):经验参数法经验参数法经验参数法经验参数法由由Chou Chou 和和FasmanFasman在在7070年代提出年代提

90、出的。的。根据每种氨基酸残基形成二级结构的倾根据每种氨基酸残基形成二级结构的倾向性或者统计规律进行二级结构预测向性或者统计规律进行二级结构预测三种基本二级结构平均占氨基酸残基的三种基本二级结构平均占氨基酸残基的85%85%各种二级结构非均匀地分布在蛋白质中各种二级结构非均匀地分布在蛋白质中,如如血红蛋白蛋白质中含大量血红蛋白蛋白质中含大量 螺旋螺旋;铁氧蛋白铁氧蛋白中很少中很少 螺旋螺旋,免疫球蛋白以免疫球蛋白以 折叠为主折叠为主每种氨基酸出现在各种二级结构中倾向或者每种氨基酸出现在各种二级结构中倾向或者频率是不同的频率是不同的,例如:例如:GluGlu主在主在 螺旋中螺旋中,AspAsp和和

91、GlyGly主要在转角中主要在转角中关于二级结构的经验规则关于二级结构的经验规则一个氨基酸残基的构象倾向性因子定义为一个氨基酸残基的构象倾向性因子定义为P Pi i = A = Ai i / T / Ti i (i= (i= ,c, t),c, t)式中式中:下标下标i i表示构象态表示构象态如如 螺旋、螺旋、折叠、转角、无规卷曲等;折叠、转角、无规卷曲等;T Ti i是所有被统计残基处于构象态是所有被统计残基处于构象态i i的比例;的比例;A Ai i是第是第A A种残基处于构象态种残基处于构象态i i 的比例;的比例;P Pi i大于大于1.01.0表示该残基倾向于形成二级结构构象表示该残

92、基倾向于形成二级结构构象i i,小于,小于1.01.0则表示倾向于形成其它构象。则表示倾向于形成其它构象。 经验规则的基本思想是在序列中寻找规则二级结经验规则的基本思想是在序列中寻找规则二级结构的成核位点和终止位点。构的成核位点和终止位点。 扫描输入的氨基酸序列,利用一组规则发现可扫描输入的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列,然后能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于直到倾向性因子小于1.01.0为止。为止。 规则:(i i)螺旋规则螺旋规则 (iiii)折叠规则折

93、叠规则 (iiiiii)转角规则)转角规则 (iv) (iv) 重叠规则重叠规则 延伸 成核区 延伸(i i)螺旋规则螺旋规则沿蛋白质序列寻找沿蛋白质序列寻找螺旋核螺旋核相邻的相邻的6 6个残基中如果有至少个残基中如果有至少4 4个残基倾向个残基倾向于形成于形成螺旋,则认为是螺旋核。螺旋,则认为是螺旋核。从螺旋核向两端延伸从螺旋核向两端延伸直至四肽片段的直至四肽片段的螺旋倾向性因子的平均螺旋倾向性因子的平均值值PP 1.01.031.03,则预测为螺旋。,则预测为螺旋。 (iiii)折叠规则折叠规则相邻相邻6 6个残基中若有个残基中若有4 4个倾向于形成个倾向于形成折叠,折叠,则认为是折叠核。

94、则认为是折叠核。折叠核向两端延伸直至折叠核向两端延伸直至4 4个残基的平均折叠倾个残基的平均折叠倾向性因子向性因子PP 1.01.051.05,则预测为,则预测为折折叠。叠。(iiiiii)转角规则)转角规则转角的模型为四肽转角的模型为四肽转角的模型为四肽转角的模型为四肽四肽片段四肽片段PtPt的平均值大于的平均值大于100100,并且,并且Pt Pt 的均值同时大于的均值同时大于P P 的均值以及的均值以及P P 的均值,则可以预测这样连续的的均值,则可以预测这样连续的4 4个残个残基形成转角。基形成转角。 则可以预测这样连续的则可以预测这样连续的4 4个氨基酸形成转个氨基酸形成转角。角。(

95、iv) (iv) 重叠规则重叠规则对于螺旋和折叠的重叠区域,按对于螺旋和折叠的重叠区域,按PPa a 和和PP 的相对大小进行预测的相对大小进行预测若若PPa a 大于大于PP ,则预测为螺旋;,则预测为螺旋;反之,预测为折叠。反之,预测为折叠。ARamachandrandiagramshowingthestericallyARamachandrandiagramshowingthestericallyreasonablevaluesoftheanglesreasonablevaluesoftheanglesandand.(2)GOR方法方法是一种基于信息论和贝叶斯统计学的方法,是一种基于信息

96、论和贝叶斯统计学的方法,也属于统计学方法,也属于统计学方法,GORGOR方法不仅考虑被预测方法不仅考虑被预测位置本身氨基酸残基种类对该位置构象的影位置本身氨基酸残基种类对该位置构象的影响,也考虑到相邻残基种类对该位置构象的响,也考虑到相邻残基种类对该位置构象的影响。这样使预测的成功率提高到影响。这样使预测的成功率提高到65%65%左右。左右。GORGOR方法的优点是物理意义清楚明确,数学表方法的优点是物理意义清楚明确,数学表达严格,而且很容易写出相应的计算机程序,达严格,而且很容易写出相应的计算机程序,但缺点是表达式复杂。但缺点是表达式复杂。序列窗口序列窗口中心残基中心残基窗口中各个残基对中心

97、残基二级结构的支持程度窗口中各个残基对中心残基二级结构的支持程度两个事件两个事件两个事件两个事件S S S S和和和和R R R R的条件概率的条件概率的条件概率的条件概率P(P(P(P(S S S S| | | |R R R R) ) ) )即在即在即在即在R R R R发生的条件下,发生的条件下,发生的条件下,发生的条件下,S S S S发生的概率发生的概率发生的概率发生的概率定义信息为:定义信息为:定义信息为:定义信息为: 若若若若S S S S和和和和R R R R无关,则无关,则无关,则无关,则 I(S; R)=0I(S; R)=0I(S; R)=0I(S; R)=0若若若若R R

98、R R的发生有利于的发生有利于的发生有利于的发生有利于S S S S的发生,则的发生,则的发生,则的发生,则I(S; R)0I(S; R)0I(S; R)0I(S; R)0若若若若R R R R的发生不利于的发生不利于的发生不利于的发生不利于S S S S的发生,则的发生,则的发生,则的发生,则I(S; R)0I(S; R)0I(S; R)0I(S; R)0I(S; R)I(S; R)在二级结构预测中的含义在二级结构预测中的含义R R代表中心氨基酸及其所处环境代表中心氨基酸及其所处环境S S代表二级结构类型代表二级结构类型I(S; R)I(S; R)代表中心氨基酸处于代表中心氨基酸处于S S的

99、信的信息值息值 例如:假定数据库中有例如:假定数据库中有18301830个残基,个残基, 780 780个处个处于螺旋态,于螺旋态,10501050个处于非螺旋态个处于非螺旋态,库中共有库中共有390390个丙氨酸(个丙氨酸(A A),有),有240240个个A A处于螺旋态,其处于螺旋态,其余余150150个个 A A 处于非螺旋态。可得:处于非螺旋态。可得:基于已有知识的预测方法基于已有知识的预测方法(knowledgebasedmethod)这类预测方法包括这类预测方法包括Lim和和Cohen两种方法。两种方法。Lim方法是一种物理化学的方法,它根据氨基酸残基方法是一种物理化学的方法,它

100、根据氨基酸残基的物理化学性质,包括:疏水性、亲水性、带电性以的物理化学性质,包括:疏水性、亲水性、带电性以及体积大小等,并考虑残基之间的相互作用而制订出及体积大小等,并考虑残基之间的相互作用而制订出一套预测规则。一套预测规则。对于小于对于小于50个氨基酸残基的肽链,个氨基酸残基的肽链,Lim方法的预测准确率可以达到方法的预测准确率可以达到73%.另一种是另一种是Cohen方法,它的提出当时是为了方法,它的提出当时是为了/蛋白蛋白的预测,基本原理是说:疏水性残基决定了二级结构的预测,基本原理是说:疏水性残基决定了二级结构的相对位置,螺旋亚单元或扩展单元是结构域的核心,的相对位置,螺旋亚单元或扩展

101、单元是结构域的核心,螺旋和螺旋和折叠组成了结构域。折叠组成了结构域。人工神经网络方法人工神经网络方法神经网络的方法进行序列的预测,即反馈式神经神经网络的方法进行序列的预测,即反馈式神经网络算法是目前二级结构预测应用最广的神经网络网络算法是目前二级结构预测应用最广的神经网络算法,它是由三层相同的神经元构成的层状网络,算法,它是由三层相同的神经元构成的层状网络,使用反馈式学习规则,在学习过程中根据输入的一使用反馈式学习规则,在学习过程中根据输入的一级结构和二级结构的关系的信息不断调整各单元之级结构和二级结构的关系的信息不断调整各单元之间的权重,最终目标是找到一种好的输入与输出的间的权重,最终目标是

102、找到一种好的输入与输出的映象,并对未知二级结构的蛋白进行预测映象,并对未知二级结构的蛋白进行预测神经网络方法的优点是应用方便,获得结果较快神经网络方法的优点是应用方便,获得结果较快较好,主要缺点是没有反映蛋白的物理和化学特性,较好,主要缺点是没有反映蛋白的物理和化学特性,而且利用大量的可调参数,使结果不易理解。许多而且利用大量的可调参数,使结果不易理解。许多预测程序如预测程序如PHD、PSIPRED等均结合利用了神经网等均结合利用了神经网络的计算方法。络的计算方法。综合方法综合方法综合方法不仅包括各种预测方法的综合,而综合方法不仅包括各种预测方法的综合,而且也包括结构实验结果、序列对比结果、蛋

103、且也包括结构实验结果、序列对比结果、蛋白质结构分类预测结果等信息的综合。白质结构分类预测结果等信息的综合。多个程序同时预测,综合评判多个程序同时预测,综合评判一致结果一致结果序列比对与二级结构预测序列比对与二级结构预测双重预测双重预测首先预测蛋白质的结构类型首先预测蛋白质的结构类型然后再预测二级结构然后再预测二级结构利用进化信息预测蛋白质的二级结构利用进化信息预测蛋白质的二级结构蛋白质序列家族中氨基酸的替换模式是高度特蛋白质序列家族中氨基酸的替换模式是高度特异的,如何利用这样的进化信息是二级结构预异的,如何利用这样的进化信息是二级结构预测的关键。测的关键。蛋白质二级结构预测软件系统蛋白质二级结

104、构预测软件系统 PHDPHD第一步工作是形成同源序列的多重对比排列第一步工作是形成同源序列的多重对比排列 第二步工作是将得到的多重比对的统计结果第二步工作是将得到的多重比对的统计结果送到一个神经网络中计算。送到一个神经网络中计算。Levelsofproteinstructuremotif与与domainMotif,模体,基序,模体,基序MotifinbiochemistryMotif,模体,基序模体,基序,超二级结构超二级结构,二级结二级结构有规律的组合。构有规律的组合。Structuralmotif,结构结构模体模体,氨基酸的空间排列形氨基酸的空间排列形成的蛋白质空间结构类型成的蛋白质空间结

105、构类型,核苷酸的空间排列形核苷酸的空间排列形成的核酸空间结构类型成的核酸空间结构类型Sequencemotif,DNA中一个核苷酸序列模式或中一个核苷酸序列模式或蛋白质中一个序列模式蛋白质中一个序列模式晶体结构的一个重复模式元件Sequencemotif遗传学:序列模体是一个核苷酸序列或氨基酸遗传学:序列模体是一个核苷酸序列或氨基酸序列模式序列模式,普遍普遍分布分布,被推测被推测有有生物学意义。生物学意义。元素的一个重复模式在水晶结构元素的一个重复模式在水晶结构对蛋白质对蛋白质,序列模体区别于结构模体序列模体区别于结构模体,一个结构模一个结构模体所形成的三维排列体所形成的三维排列,氨基酸不接近

106、。氨基酸不接近。Sequence motifWhenasequencemotifappearsintheexonofagene,itmayencodethestructuralmotifofaproteinOutsideofgeneexons,thereexistregulatorysequencemotifsandmotifswithinthejunk,suchassatelliteDNA.Someofthesearebelievedtoaffecttheshapeofnucleicacids,butthisisonlysometimesthecase.Shortcodingmotifs,w

107、hichappeartolacksecondarystructure,includethosethatlabelproteinsfordeliverytoparticularpartsofacell,ormarkthemforphosphorylation.Withinasequenceordatabaseofsequences,researcherssearchandfindmotifsusingcomputer-basedtechniquesofsequenceanalysis,suchasBLAST.StructuralmotiftypesinproteinsExamplesofmoti

108、ftypesinproteinsBetaribbonOmegaloopHelix-loop-helixZincfingerHelix-turn-helixBetahairpinMotifbioinformaticsMotifs and consensus sequences Motifs and consensus sequences De novo computational discovery of motifs De novo computational discovery of motifs Discovery through evolutionary conservation Dis

109、covery through evolutionary conservation Pattern description notations Pattern description notations PROSITE pattern notation PROSITE pattern notation Matrices Matrices Another scheme Another scheme Motif-findingmethodsMINIMOTIFMINERThepublicinterfacetotheminimotifminerdatabasePROSITEDatabaseofprote

110、infamiliesanddomainsDatabaseandAnalysisSuiteforQuadruplexformingmotifsinNucleotideSequencesTheMEME/MASTSystemforMotifDiscoveryandSearchMEMEDocumentationTRANSFAC:ApublicdatabasefortranscriptionfactormotifseMotifhomepage(fromStanfordUniversity)Bioprospectorhomepage(fromStanfordUniversity)TEIRESIShomep

111、ageImprobizerhomepageBLOCK-makerhomepageNCBIHomePageNIHsNationalLibraryofMedicineNCBI(NationalCenterforBiotechnologyInformation)TranscriptionalRegulationWikiWikiomicSequencemotifspagePLACEProteinbindingmotif ProteinbindingmotifProteinbindingmotifisashortproteinisashortproteinsequencemotifsequencemot

112、if thatthatinteractswithotherinteractswithotherproteinsproteins. .AtypicalexampleofsuchmotifareAtypicalexampleofsuchmotifareprolineproline-rich-richsequencesthatareresponsibleforbindingofsequencesthatareresponsibleforbindingofSH3SH3domainsdomains. .ProteinbindingsequencesmaybeProteinbindingsequences

113、maybelocallyunfoldedlocallyunfolded,as,asinmanyendocyticproteins.Forexample,someinmanyendocyticproteins.Forexample,someEHEHdomainsdomainscontainatleast15repeatsofAsp-Pro-Phecontainatleast15repeatsofAsp-Pro-Phetripeptide,whichareresponsibleforinteractionwithtripeptide,whichareresponsibleforinteractio

114、nwithmultiplecopiesofthemultiplecopiesoftheAP2alphaappendageAP2alphaappendageprotein.protein.Proteindomain结构域(结构域(domain)又称为辖区。指蛋白质亚基)又称为辖区。指蛋白质亚基中明显分开的紧密球状区域中明显分开的紧密球状区域。蛋白质三级结构内的独立折叠单元蛋白质三级结构内的独立折叠单元是介于二级和三级结构之间的一种结构层次是介于二级和三级结构之间的一种结构层次,对于较小的蛋白质分子或亚基,对于较小的蛋白质分子或亚基,“结构域结构域”和和“三三级结构级结构”往往是一个概念,单结构域

115、分子往往是一个概念,单结构域分子既是结构单位,又是功能单位既是结构单位,又是功能单位-功能域功能域结构域通常都是几个超二级结构单元的组合。结构域通常都是几个超二级结构单元的组合。结构域在空间上具有临近相关性结构域在空间上具有临近相关性。即在一级结即在一级结构上相互临近的氨基酸残基,在结构域的三维构上相互临近的氨基酸残基,在结构域的三维空间结构上也相互临近空间结构上也相互临近。结构域结构域常见结构域的氨基酸残基数在常见结构域的氨基酸残基数在40400个之间,个之间,最小的结构域只有最小的结构域只有4050个氨基酸残基,大的个氨基酸残基,大的结构域可超过结构域可超过400个氨基酸残基。个氨基酸残基

116、。链接两个结构域的绝大多数都是单股肽链,极链接两个结构域的绝大多数都是单股肽链,极个别的情况下会有少双股肽链联系。在个别的情况下会有少双股肽链联系。在X-射线射线衍射绘制的电子密度存在一些裂隙,这些裂隙衍射绘制的电子密度存在一些裂隙,这些裂隙就是结构域之间的链接部分就是结构域之间的链接部分有时一个结构域就可以独立完成一项生理功能,有时一个结构域就可以独立完成一项生理功能,但是一个结构不完整的结构域是不可能产生生但是一个结构不完整的结构域是不可能产生生理功能的。因此结构域是蛋白质生理功能的结理功能的。因此结构域是蛋白质生理功能的结构基础,但必须指出的是,虽然结构域与蛋白构基础,但必须指出的是,虽

117、然结构域与蛋白质的功能关系密切,但是结构域和功能域的概质的功能关系密切,但是结构域和功能域的概念并不相同。念并不相同。模体和结构域的区别模体和结构域的区别在蛋白质中,有时在蛋白质中,有时基序基序,结构域交替使用,但结构域交替使用,但结构结构域不是域不是基序基序,结构域包含结构域包含基序基序结构模体即超二级结构,是二级结构有规律的结构模体即超二级结构,是二级结构有规律的组合。例如螺旋组合。例如螺旋-环环-螺旋、锌指结构,即模体即螺旋、锌指结构,即模体即是结构的单位,又是功能单位,他们可直接作是结构的单位,又是功能单位,他们可直接作为结构域和三级结构的建筑块。为结构域和三级结构的建筑块。结构域是指

118、在较大的蛋白质分子中形成的某些结构域是指在较大的蛋白质分子中形成的某些在空间上可以辨别的结构,往往是球状压缩区在空间上可以辨别的结构,往往是球状压缩区或纤维状压缩区。它们既是结构单位,又是功或纤维状压缩区。它们既是结构单位,又是功能单位。例如免疫球蛋白的功能区就是结构域。能单位。例如免疫球蛋白的功能区就是结构域。显然模体与结构域是不同的概念。显然模体与结构域是不同的概念。丙酮酸激酶,三个结构域蛋白丙酮酸激酶,三个结构域蛋白n nanall-regulatoryanall-regulatorydomain,domain,n nan/-substratean/-substratebindingdo

119、mainbindingdomainn nan/-nucleotidean/-nucleotidebindingdomainbindingdomainn nconnectedbyseveralconnectedbyseveralpolypeptidelinkerspolypeptidelinkersn nEachdomaininthisEachdomaininthisproteinoccursindiverseproteinoccursindiversesetsofproteinfamilies.setsofproteinfamilies. 结构域数据库结构域数据库Structuraldomai

120、ndatabases 3DeeCATHDALISCOPPawsonLab-ProteininteractiondomainsNashLab-ProteininteractiondomainsinSignalTransductionDefinitionandassignmentofstructuraldomainsinproteins序列域数据库序列域数据库SequencedomaindatabasesInterProInterPro PfamPfam PROSITEPROSITEProDomProDom SMARTSMART NCBI Conserved Domain DatabaseNCBI

121、 Conserved Domain Database SUPERFAMILYSUPERFAMILY Library of HMMs Library of HMMs representing superfamilies and database representing superfamilies and database of (superfamily and family) annotations of (superfamily and family) annotations for all completely sequenced organisms for all completely sequenced organisms

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号