蛋白质序列分析及结构预测课堂PPT

上传人:夏** 文档编号:590060693 上传时间:2024-09-12 格式:PPT 页数:73 大小:5.21MB
返回 下载 相关 举报
蛋白质序列分析及结构预测课堂PPT_第1页
第1页 / 共73页
蛋白质序列分析及结构预测课堂PPT_第2页
第2页 / 共73页
蛋白质序列分析及结构预测课堂PPT_第3页
第3页 / 共73页
蛋白质序列分析及结构预测课堂PPT_第4页
第4页 / 共73页
蛋白质序列分析及结构预测课堂PPT_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《蛋白质序列分析及结构预测课堂PPT》由会员分享,可在线阅读,更多相关《蛋白质序列分析及结构预测课堂PPT(73页珍藏版)》请在金锄头文库上搜索。

1、生物信息学生物信息学谢文海谢文海讲师讲师1第第五章五章 蛋白质序列分析及结构预测蛋白质序列分析及结构预测一、蛋白质的结构一、蛋白质的结构二、蛋白质数据库介绍二、蛋白质数据库介绍三、蛋白质序列分析三、蛋白质序列分析四、蛋白质结构预测四、蛋白质结构预测五、蛋白质功能预测五、蛋白质功能预测2从多条免疫球蛋白序列中提取的从多条免疫球蛋白序列中提取的8 8个片段的多重比对个片段的多重比对疏水氨基酸色氨酸半胱氨酸保守结构域免疫球蛋白恒定区免疫球蛋白可变区回顾31.human beta globin (人(人珠蛋白)珠蛋白)2.horse beta globin (马(马珠蛋白)珠蛋白)3.human al

2、pha globin (人(人珠蛋白)珠蛋白)4.horse alpha globin (马(马珠蛋白)珠蛋白)5.cyanohaemoglobin (蓝血红蛋白)(蓝血红蛋白)6. whale myoglobin (鲸肌红蛋白)(鲸肌红蛋白)7.Leghaemoglobin (豆血红蛋白)(豆血红蛋白)通过珠蛋白的比通过珠蛋白的比较构建系统发育较构建系统发育树判断生物进化树判断生物进化分歧时间分歧时间回顾4DNA 序列蛋白序列蛋白结构功能结构是蛋白行使功能的前提5一、蛋白质的结构一、蛋白质的结构蛋白质的结构主要分为四级蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构以及四级结一级结构

3、、二级结构、三级结构以及四级结构构。一级结构一级结构:蛋白质多肽链中氨基酸残基的排列顺序蛋白质多肽链中氨基酸残基的排列顺序MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE6蛋白质二级结构蛋白质二级结构二级结构:主要由氢键维系的结构(二级结构:主要由氢键维系的结构(-螺旋螺旋、-折叠折叠)指多肽指多肽链中主链原子的局部空间排布即构象,不涉及侧链部分的构象。链中主链原子的局部空间排布即构象,不涉及侧链部分的构象。螺旋、螺旋、折叠、折叠、转角、无规卷曲转角、无规卷曲、螺旋组合(螺旋组合()折叠组合(折叠组合()和)和螺旋螺旋折叠组合(折叠组合()7 螺旋螺旋

4、(helix)的结构特征为:的结构特征为:(1)主链骨架围绕中心轴盘绕形成右手螺旋;)主链骨架围绕中心轴盘绕形成右手螺旋;(2)螺旋每上升一圈是)螺旋每上升一圈是3.6个氨基酸残基,螺距为个氨基酸残基,螺距为0.54nm;(3)相邻螺旋圈之间形成许多氢键;)相邻螺旋圈之间形成许多氢键;(4)侧链基团位于螺旋的外侧。)侧链基团位于螺旋的外侧。Ala、Glu、Leu、Met 促进形成促进形成 Pro、 Gly、Tyr、Ser不利于形成不利于形成人细胞珠蛋白人细胞珠蛋白人细胞珠蛋白人细胞珠蛋白(2DC3.pdb)(2DC3.pdb)(2DC3.pdb)(2DC3.pdb)的第的第的第的第121121

5、121121到到到到140140140140位残基位残基位残基位残基对应的对应的对应的对应的a-a-a-a-螺旋侧面和顶部螺旋侧面和顶部螺旋侧面和顶部螺旋侧面和顶部(N(N(N(N端端端端) ) ) )视图视图视图视图8(1)若干条肽链或肽段平行或反平行排列成片;)若干条肽链或肽段平行或反平行排列成片;(2)所有肽键的)所有肽键的C=O和和NH形成链间氢键;形成链间氢键;(3)侧链基团分别交替位于片层的上、下方。)侧链基团分别交替位于片层的上、下方。 折叠折叠(sheets) 的结构特征为:的结构特征为:a.反反平行和平行的多个平行和平行的多个折叠链形成一个完整折叠链形成一个完整折叠结构的氢键

6、示意图折叠结构的氢键示意图;b.来自来自人人pi型谷胱甘肽型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分转硫酶中单个亚基中连续主链的部分折叠结构折叠结构(2DGQ.pdb)侧面视侧面视图,可见转角图,可见转角(turn); c.来自来自人人pi型谷胱甘肽型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分转硫酶一个亚基中连续主链的部分折叠结构顶部视图,可见转角折叠结构顶部视图,可见转角(turn);d.来自来自人信号传递蛋白人信号传递蛋白SMAD4(1DD1.pdb)的一个亚基中部分的一个亚基中部分折叠结构顶部视图,可见到大折叠结构顶部视图,可见到大的环区的环区(loop)。 9多肽链多肽链180

7、回折部分,通常由四个氨基酸残基构成,借回折部分,通常由四个氨基酸残基构成,借1. 4残基之残基之间形成的氢键维系。间形成的氢键维系。 Asp、Asn、Ser、Thr、Gln 、Pro 常出现在常出现在转角转角转角的结构特征为:转角的结构特征为:来自人细胞珠蛋白来自人细胞珠蛋白(2DC3.pdb)的两段的两段螺旋由螺旋由转角连接,用粗树枝状显转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。示了两段螺旋末端的脯氨酸。10无规卷曲的结构特征为:无规卷曲的结构特征为: 无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波

8、动性较大,对温度变化敏感;实验测定三级结构时往化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法识别无规卷曲往无法识别无规卷曲(缺失其座标缺失其座标),即使有座标则其温度因子也较高。,即使有座标则其温度因子也较高。无规卷曲同无规卷曲同环的区分主要是其长度和其形状的波动性。环的区分主要是其长度和其形状的波动性。 11超二级结构的主要类型和特征超二级结构的主要类型和特征 超二级结构超二级结构(supersecondary structure)指位于同一主链的多个二级指位于同一主链的多个二级结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成单元,结构组装形成的特定组装体,可

9、直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。形成的模体。 12(1)转角或转角或环等连接连续四个环等连接连续四个螺旋形成的四螺旋形成的四螺旋捆;螺旋捆;(2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的含有强亲水侧链氨基酸的螺旋组成的亮氨酸拉链螺旋组成的亮氨酸拉链(Leucine zipper);(3)一条主链中相邻七个两亲)一条主链中相邻七个两亲螺旋通过过度结构形成

10、的七次穿膜螺旋螺旋通过过度结构形成的七次穿膜螺旋组;组;(4)连续主链中两段)连续主链中两段螺旋连接三段螺旋连接三段折叠链形成的折叠链形成的Rossmann折叠;折叠;(5)转角连接转角连接a螺旋构成的螺旋构成的a-螺旋螺旋-转角转角-螺旋;螺旋;(6)环连接环连接螺旋构成的螺旋构成的螺旋螺旋-环环-螺旋等。螺旋等。(7)-折叠都为超二级结构。折叠都为超二级结构。 超二级结构的主要类型:超二级结构的主要类型:13蛋白质三级结构蛋白质三级结构二级结构进一步折叠形成的结构域14三级结构三级结构:蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或折迭

11、形成具有一定规律的三维空间结构,称为蛋白质的三级结构折迭形成具有一定规律的三维空间结构,称为蛋白质的三级结构(tertiary structure)。蛋白质三级结构的稳定主要靠次级键,包括)。蛋白质三级结构的稳定主要靠次级键,包括氢键、疏水键、盐键以及范德华力(氢键、疏水键、盐键以及范德华力(Van der Wasls力)等。力)等。15四级结构四级结构:具有二条或二条以上独立三级结构的多肽链组成的蛋白具有二条或二条以上独立三级结构的多肽链组成的蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质的四级结构(质的四级结构(qua

12、rternary structure)。其中,每个具有独立)。其中,每个具有独立三级结构的多肽链单位称为亚基(三级结构的多肽链单位称为亚基(subunit)。)。16蛋白质的一级结构决定了蛋白质的二级、三级、四级结构蛋白质的一级结构决定了蛋白质的二级、三级、四级结构171. 1. 蛋白质序列数据库:蛋白质序列数据库:蛋白质序列数据库:蛋白质序列数据库:如如PIR、SWISS-PROT、NCBI , 这些数据库的这些数据库的数据主要以蛋白质的序列为主数据主要以蛋白质的序列为主, 并赋予相应的注释并赋予相应的注释; 2. 2. 蛋白质模体及结构域数据库:蛋白质模体及结构域数据库:蛋白质模体及结构域

13、数据库:蛋白质模体及结构域数据库:如如PROSITE、Pfam, 这些数据库主要这些数据库主要收集了蛋白质的保守结构域和功能域的特征序列收集了蛋白质的保守结构域和功能域的特征序列; 3. 3. 蛋白质结构数据库:蛋白质结构数据库:蛋白质结构数据库:蛋白质结构数据库: 如如PDB 等等, 这些数据库主要以蛋白质的结构测这些数据库主要以蛋白质的结构测量数据为主量数据为主; 4. 4. 蛋白质分类数据库:蛋白质分类数据库:蛋白质分类数据库:蛋白质分类数据库:如如SCOP、CATH、FSSP 等等, 这其中有以序列这其中有以序列比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据库比较为基础的

14、序列分类数据库以及以结构比较为基础的结构分类数据库之分。之分。依据蛋白质的结构层次依据蛋白质的结构层次, 将蛋白质数据库分为将蛋白质数据库分为: 二、蛋白质数据库二、蛋白质数据库18蛋白质数据库蛋白质数据库特征特征特征特征: :r 这些数据库种类有差别这些数据库种类有差别, 但内部是相互联系的但内部是相互联系的.r 每个数据库都有指针指向其他数据库每个数据库都有指针指向其他数据库, 而且数据而且数据库之间的序列以及相应的结构是共享的库之间的序列以及相应的结构是共享的, 同一种同一种蛋白质依次会出现在不同的数据库蛋白质依次会出现在不同的数据库.r这样的数据沟通有助于更深层地挖掘蛋白质的这样的数据

15、沟通有助于更深层地挖掘蛋白质的内在生物信息内在生物信息, 这些数据库是融序列信息的索取、这些数据库是融序列信息的索取、处理、存储、输出于一身的。处理、存储、输出于一身的。191.蛋白质序列数据库蛋白质序列数据库(1)PIR(protein information resource, PIR)和和PSD (protein sequence database, PSD) http:/pir.georgetown.edu/pirwww PIR-PSD 是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白质序列数据库。质序列数据库。PIR-PSD

16、 的序列来自于将的序列来自于将GenBank/ EMBL/ DDBJ 三大三大数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用户直接提交的序列。户直接提交的序列。(2)SWISS-PROT/ TrEMBL数据库数据库 www.expasy.org/swissprot数据库由蛋白质序列条目构成数据库由蛋白质序列条目构成, 每个条目包含蛋白质序列、引用文献信每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等息、分类学信息、注释等, 注释中包括蛋白质的功能、转录后修饰位点、注释中包括蛋白质的功能、转录后修饰位点、特殊位

17、点和区域、二级结构、四级结构、与其他序列的相似性、序列特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、序列变异体等信息。残缺与疾病的关系、序列变异体等信息。202.模体以及结构域数据库模体以及结构域数据库模体数据库模体数据库(1)PROSITE 蛋白质家族及结构域数据库蛋白质家族及结构域数据库( www.expasy.org/prosite/ ) PROSITE 数据库收集了有显著生物学意义的蛋白质位点序列、蛋白质特征序列谱库以及序列模型, 并能依据这些特征属性快速可靠地鉴定出一个未知功能蛋白质序列属于哪个蛋白质家族, 即使在蛋白质序列相似性很低的情况下, 也可以

18、通过搜索隐含的功能结构模体(motif)来鉴定, 因此是有效的序列分析数据库。 PROSITE 中涉及的序列模式包括酶的催化位点、配体结合位点、金属离子结合位点、二硫键、小分子或者蛋白质结合区域等, 此外PROSITE 还包括由多序列比对构建的序列表谱( profile) , 能更敏感地发现序列中的信息。21PROSITE同时数据库提供了序列分析工具同时数据库提供了序列分析工具: ScanProsite 是用于搜索所提交的序列数据是否包是用于搜索所提交的序列数据是否包含含 PROSITE 数据库中的序列模式或者数据库中的序列模式或者SWISS-PROT 数据库中已提交的序列模式数据库中已提交的

19、序列模式; MotifScan 用于查找未知序列中所有可能的已知结用于查找未知序列中所有可能的已知结构组件构组件, 数据库包括数据库包括PROSITE序列表谱、序列表谱、PROSITE 模式、模式、Pfam 收集的隐马尔可夫模式收集的隐马尔可夫模式( HMM)。22(2) PRINTS Fingerprint Database www.bioinf.man.ac.uk/dbrowser/PRINTS/ 这个数据库包含1 500 个蛋白质指纹图谱, 编码9 136 个单一模体。(3) BLOCKS ( www.blocks.fhcrc.org/ )BLOCKS 是通过一些高度保守的蛋白质区域比对

20、出来的无空位的片段。模体数据库模体数据库23蛋白质结构域数据库蛋白质结构域数据库 (1 ) 蛋白质家族序列比对以及隐马尔可夫模式数据库蛋白质家族序列比对以及隐马尔可夫模式数据库Pfam( protein families database of alignments and HMMs)Pfam 是蛋白质家族序列比对以及隐马尔可夫模式数据库,其网址是: www.sanger.ac.uk/Software/Pfam/index.shtml。 (2) 蛋白质结构域数据库蛋白质结构域数据库ProDom http:/prodes.toulouse.inra.fr/prodom/doc/prodom.ht

21、ml (3) SMART SMART 是一个简单的结构研究工具, 可对可转移的遗传因子进行鉴定和注解, 以及分析结构域结构, 可以检测出500 多个参与信号传导、胞外和染色体相关蛋白质的结构域家族, 对这些结构域又在系统进化树分布、功能分类、三级结构和重要的功能残基方面做了注解。 http:/smart.embl-heidelberg.de/243.蛋白质结构数据库蛋白质结构数据库PDB( protein data bank , PDB) http:/www.rcsb.org/pdb/PDB 包括了蛋白质、核酸、蛋白质-核酸复合体以及病毒等生物大分子结构数据, 主要是蛋白质结构数据, 这些数据

22、来源于几乎全世界所有从事生物大分子结构研究的研究机构, 并由结构生物学合作研究协会(RCSB) 维护和注释。254.蛋白质结构分类数据库蛋白质结构分类数据库(1) CATH 数据库数据库 www.biochem.ucl.ac.uk/bsm/cathnew/index.html(2) SCOP 蛋白质结构分类数据库蛋白质结构分类数据库( structural classification of protein database,SCOP) scop.mrclmb.cam.ac.uk/scop/index.html26三、蛋白质的序列分析三、蛋白质的序列分析蛋白质序列分析蛋白质序列分析蛋白质一级序

23、列蛋白质一级序列蛋白质基本理化性质分析蛋白质基本理化性质分析蛋白质亲疏水性分析蛋白质亲疏水性分析跨膜区结构预测跨膜区结构预测卷曲螺旋预测卷曲螺旋预测翻译后修饰位点预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构蛋白质二级结构预测蛋白质二级结构预测蛋白质序列信号位点分析蛋白质序列信号位点分析蛋白质超二级结构蛋白质超二级结构蛋白质结构域分析蛋白质结构域分析蛋白质三级结构蛋白质三级结构蛋白质三维结构模拟蛋白质三维结构模拟蛋白质分类蛋白质分类蛋白质家族分析蛋白质家族分析2728蛋白质理化性质是蛋白质研究的基础蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质:蛋白质的基本性质:相对分子质量相对分子质

24、量 氨基酸组成氨基酸组成等电点(等电点(PIPI) 消光系数消光系数半衰期半衰期 不稳定系数不稳定系数总平均亲水性总平均亲水性 实验方法:实验方法:相对分子质量的测定、等电点实验、沉降实验相对分子质量的测定、等电点实验、沉降实验缺点:费时、耗资缺点:费时、耗资基于实验经验值的计算机分析方法基于实验经验值的计算机分析方法1.1.蛋白质基本理化性质分析蛋白质基本理化性质分析 29基于一级序列的组分分析基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考氨基酸亲疏水性等分析为高级结构预测提供参考Expasy 开发的针对蛋白质基本理化性质的分析:开发的针对蛋白质基本理化性质的分析:Prot

25、param 工具工具 http:/www.expasy.org/tools/protparam.html相对分子质量相对分子质量氨基酸组成氨基酸组成等电点(等电点(PI)消光系数消光系数半衰期半衰期不稳定系数不稳定系数总平均亲水性总平均亲水性30工具工具网站网站备注备注AACompldenthttp:/expasy.org/tools/aacomp/利利用用未未知知蛋蛋白白质质的的氨氨基基酸酸组组成成确确认认具具有有相相同同组组成成的的已已知知蛋白蛋白ComputepI/Mwhttp:/expasy.org/tools/pi_tool.html计计算算蛋蛋白白质质序序列列的的等等电电点点和和分

26、子量分子量ProtParamhttp:/expasy.org/tools/protparam.html对对氨氨基基酸酸序序列列多多个个物物理理和和化化学学参参数数(分分子子量量、等等电电点点、吸光系数等)进行计算吸光系数等)进行计算PeptideMasshttp:/expasy.org/tools/peptide-mass.html计算相应肽段的计算相应肽段的pI和分子量和分子量SAPShttp:/www.isrec.isb-sib.ch/software/SAPS_form.html利利用用蛋蛋白白质质序序列列统统计计分分析析方方法法给给出出待待测测蛋蛋白白的的物物理理化化学学信息信息蛋白质

27、理化性质分析工具蛋白质理化性质分析工具31AACompIdent PeptideMass32Protparam 工具 http:/www.expasy.org/tools/protparam.html计算以下物理化学性质:计算以下物理化学性质:相对分子质量 理论 pI 值氨基酸组成 原子组成消光系数 半衰期不稳定系数 脂肪系数总平均亲水性33主要选项主要选项/参数参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot

28、/TrEMBLAC号号打开打开protein.txt,将蛋白质序列将蛋白质序列粘贴在搜索框中粘贴在搜索框中34输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果输出结果功能功能域域用户自定义区用户自定义区段段35点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果氨基酸数目氨基酸数目相对分子质量相对分子质量理论理论pI值值氨基酸组成氨基酸组成正正/负电荷残基数负电荷残基数3637消光系数消光系数半衰期半衰期原子组成原子组成分子式分子式总原子数总原子数37不稳定系数不稳定系数脂肪系数脂肪系数总平均亲水总平均亲水性性

29、40unstable38(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins2 2、蛋白质亲疏水性、蛋白质亲疏水性/ /跨膜区分析跨膜区分析393 3、蛋白质亲疏水性分析、蛋白质亲疏水性分析氨基酸侧链的疏水性用从各氨基酸减去甘氨酸疏水性之值来表示,蛋白质的疏水性在保持蛋白质三级结构的形成和稳定中起着重要作用。疏水作用

30、是蛋白质折叠的主要驱动力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步氨基酸疏水分析为蛋白质二级结构预测提供佐证可用于分析蛋白质相互作用位点-抗原位点预测(预测准确率达56%)是分析蛋白质跨膜区重要一步40海参溶菌酶亲水性海参溶菌酶亲水性/疏水性分析疏水性分析Score 0,表示疏水性; Score 0,表示亲水性41螺旋跨膜区主要是由螺旋跨膜区主要是由20-30个疏水性氨基酸(个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成等)组成亲水残基往往出现在疏水残基之间,对功能有重要的亲水残基往往出现在疏水残基之间,对功能有重要的作用作用基于亲基于亲/疏水量和蛋白质膜区每个氨

31、基酸的统计学分布疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量偏好性量TMpredhttp:/www.ch.embnet.org/software/TMPRED_form.htmlSOSUI-http:/bp.nuap.nagoya-u.ac.jp/sosui/4 4、蛋白质跨膜区分析、蛋白质跨膜区分析42常用蛋白质跨膜区域分析工具常用蛋白质跨膜区域分析工具工具工具网站网站备注备注DAShttp:/www.sbc.su.se/miklos/DAS/用用DenseAlignmentSurface(DAS)算算法法来来预预测无同源家族的蛋白跨膜区测无同源家族的蛋白跨膜区HMMTOPhttp:/w

32、ww.enzim.hu/hmmtop/由由Enzymology研研究究所所开开发发的的蛋蛋白白质质跨跨膜膜区区和和拓拓扑扑结结构构预测程序预测程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由由Nagoya大大学学开开发发一一个个具具有有图形显示跨膜区的程序图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基基于于多多序序列列比比对对来来预预测测跨跨膜膜区的程序区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基基于于HMM方方法法的的蛋蛋白白质质跨跨膜区预测工具

33、膜区预测工具TMpredhttp:/www.ch.embnet.org/software/TMPRED_form.html基基于于对对TMbase数数据据库库的的统统计计分分析析来来预预测测蛋蛋白白质质跨跨膜膜区区和跨膜方向和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是是一一个个位位于于法法国国的的蛋蛋白白质质拓拓扑结构预测程序扑结构预测程序43TMHMM44ProtScale工具工具http:/ca.expasy.org/tools/protscale.html氨基酸标度氨基酸标度表示氨基酸在某种实验状

34、态下相对其他氨基酸在某些性表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等质的差异,如疏水性、亲水性等收集收集56多个文献中提供的氨基酸标度多个文献中提供的氨基酸标度默认值以默认值以Hphob.Kyte&Doolittle做疏水性分析做疏水性分析特异性氨基酸标度,如特异性氨基酸标度,如Hopp&Woods(1981)针对抗原片)针对抗原片段定位;段定位;Accessibleresidues(1979)针对氨基酸溶剂可及)针对氨基酸溶剂可及性定位;性定位;Chou&Fasman(1978)针对氨基酸二级结构疏)针对氨基酸二级结构疏水性分析水性分析5 5、蛋白质亲疏水性

35、分析、蛋白质亲疏水性分析45主要选项主要选项/ /参数参数序列在线提交形式:序列在线提交形式:如果分析如果分析SWISS-PORT和和TrEMBL数据库中序列数据库中序列直接填写直接填写Swiss-Prot/TrEMBL AC号号(accession number)如果分析新序列:如果分析新序列:直接在搜索框中粘贴氨基酸序列直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot/TrEMBLAC号号打开打开protein.txt,将一条蛋白质序列将一条蛋白质序列粘贴在搜索框中粘贴在搜索框中46计算窗口(计算窗口(7-11)相对权重值相对权重值 权重值变化趋势权重值变化趋势 氨基酸标度氨基酸标

36、度是否归一化是否归一化47输出结果输出结果输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段功能功能域域用户自定义区用户自定义区段段48所用氨基所用氨基酸标度信酸标度信息息分析所用分析所用参数信息参数信息输出结果输出结果49图形结果图形结果 文本结果文本结果 序列序列 参数参数 每个位置每个位置 的得分的得分50(3 3) 跨膜区分析跨膜区分析蛋白质含有跨膜区提示它可能作为膜受体起作用,也可蛋白质含有跨膜区提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白或离子通道蛋白。能是定位在膜上的锚定蛋白或离子通道蛋白。例,使用例,使用TMHMM Server v.2.0TMHMM

37、Server v.2.0在线分析在线分析http:/www.cbs.dtu.dk/services/TMHMM/http:/www.cbs.dtu.dk/services/TMHMM/51铝激活苹果酸的转运蛋白铝激活苹果酸的转运蛋白(TaALMT1)跨膜结构分析跨膜结构分析526 6、跨膜区分析、跨膜区分析TMpred工具工具:http:/www.ch.embnet.org/software/TMPRED_form.html预测跨膜区和跨膜方向依靠跨膜蛋白数据库Tmbase53主要参数主要参数/ /选项选项序列在线提交形式:序列在线提交形式:直接贴入蛋白序列直接贴入蛋白序列填写填写SwissP

38、rot/TrEMBL/EMBL/EST的的ID或或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列54输出结果输出结果包含四个部分包含四个部分可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表位置位置分值分值 片段中点位置片段中点位置55 跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型每一位置计算分值每一位置计算分值最优拓最优拓扑结构扑结构56SOSUI工具工具: - http:/bp.n

39、uap.nagoya-u.ac.jp/sosui/以图形方式返回结果,需要Java Applet程序输入氨基酸单字母输入氨基酸单字母运行运行57平均疏水值平均疏水值预测的跨模螺旋区预测的跨模螺旋区域域两种跨膜两种跨膜Helix58预测区域的螺旋示意预测区域的螺旋示意图图平均疏水值平均疏水值预测的跨模螺旋区预测的跨模螺旋区域域两种跨膜两种跨膜Helix59亲疏水轮亲疏水轮廓廓5960跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 -Landolt Marticorena et al., 1993胞外末端Asp、Ser和Pro胞外-内分界区域Trp跨膜区Leu、Ile、Val、Met、Phe、Trp

40、、Cys、Ala、Pro和Gly胞内-外分界区域Tyr、Trp和Phe胞内末端Lys和Arg6162两股或两股以上螺旋相互缠绕而形成超螺旋结构存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子运动、膜通道、分子识别等重要的生物功能,637 7、蛋白质卷曲螺旋域分析、蛋白质卷曲螺旋域分析 典型的有亮氨酸拉链,存在7残基 重复结构(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置 残 基为亲水性63蛋白质中由蛋白质中由2-72-7条条螺旋链相互缠绕形成类似麻花状结构螺旋链相互缠绕形成类似麻花状结构的总

41、称;的总称;主要存在形式是主要存在形式是2-52-5条相互缠绕形成的平行或反平行同寡条相互缠绕形成的平行或反平行同寡聚体或异寡聚体;聚体或异寡聚体;是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、动是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等;力蛋白、膜蛋白、酶等; 七肽重复区。七肽重复区。蛋白质卷曲螺旋域分析蛋白质卷曲螺旋域分析64工具工具网站网站备注备注Coilshttp:/www.ch.embnet.org/software/COILS_form.html主流的预测螺旋卷曲工具主流的预测螺旋卷曲工具Paircoil2http:/groups.csail.mit.ed

42、u/cb/paircoil2/paircoil2.html由由MIT大大学学开开发发的的基基于于残残基基配配对对概概率率算算法法的的预预测测工工具具PEPCOILhttp:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html由由EMBOSS维维护护的的预预测测卷卷曲螺旋程序,同曲螺旋程序,同Coils类似类似SOCKETserverhttp:/www.lifesci.sussex.ac.uk/research/woolfson/html/coiledcoils/socket/server.html一一个个分分析析蛋蛋白白质质结结构构中中卷卷曲曲螺

43、螺旋旋的的工工具具,其其输输入入数数据格式为蛋白质结构数据据格式为蛋白质结构数据TRESPASSERhttp:/comp.chem.nottingham.ac.uk/cgi-bin/trespasser/trespasser.cgi由由Nottingham大大学学开开发发的的亮氨酸拉链结构识别工具亮氨酸拉链结构识别工具2ZIPhttp:/2zip.molgen.mpg.de/index.html预预测测蛋蛋白白质质序序列列中中潜潜在在的的亮亮氨氨酸酸拉拉链链结结构构和和卷卷曲曲螺螺旋旋蛋白质卷曲螺旋预测工具蛋白质卷曲螺旋预测工具6566COILS-http:/www.ch.embnet.org

44、/software/COILS_form.htmlCOILS蛋白质卷曲螺旋预测方法基于蛋白质卷曲螺旋预测方法基于Lupas算法,是目前主流的算法,是目前主流的卷曲区域预测算法卷曲区域预测算法一般滑动窗口的大小采用一般滑动窗口的大小采用7的倍数的倍数蛋白质卷曲螺旋分析蛋白质卷曲螺旋分析67选选择择滑滑动动窗窗口口大大小小选选择择打打分分矩矩阵和权重阵和权重选选择择输输入入格格式式,选选择择“SwissProtIDorAC”查查 询询 内内 容容 , 输输 入入“GO45_HUMAN”图形结果图形结果688 8、信号肽预测、信号肽预测 信号肽:信号肽:指分泌蛋白表达时氨基端的20余个氨基酸,将引导

45、该蛋白质最终分泌至细胞外,但这段信号肽会被信号肽酶切掉,所以成熟的分泌蛋白是不含这段信号肽的。 用于指导蛋白质的跨膜转移(定位)的N末端的氨基酸序列,一般由15-30个氨基酸组成。 使用SignalP在线分析http:/www.cbs.dtu.dk/services/SignalP/69海参溶菌酶信号肽预测海参溶菌酶信号肽预测Conclusion:cleavage site between pos. 20 and 21: ASG-QV 709 9、亚细胞定位、亚细胞定位根据氨基酸组成可以进行亚细胞定位根据氨基酸组成可以进行亚细胞定位不同细胞器多具不同的理化环境,它会根据蛋白质的结不同细胞器多具

46、不同的理化环境,它会根据蛋白质的结构及表面理化特征选择性容纳蛋白质;蛋白质表面直构及表面理化特征选择性容纳蛋白质;蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成。后者取决于氨基酸组成。在线在线分析工具分析工具e.g.e.g.使用使用TargetPTargetPhttp:/www.cbs.dtu.dk/services/TargetP/http:/www.cbs.dtu.dk/services/TargetP/71组织蛋白酶组织蛋白酶CLCL和相关蛋白和相关蛋白CLAPCLAP的亚细胞定位的亚细胞定位蛋蛋白白质质各亚细

47、胞位点出现可能性(各亚细胞位点出现可能性(% %)细细胞胞质质内内质质网网线线粒粒体体细细胞胞核核 空空 泡泡分泌性分泌性小囊泡小囊泡高尔高尔基体基体质质膜膜细胞细胞支架支架CLCL34.834.834.834.88.78.78.78.74.34.34.34.34.34.3- - -CLAPCLAP26.126.14.34.313.013.013.013.04.34.317.417.44.34.313.013.04.34.3结果证明,结果证明,CLCL和和CLAPCLAP出现几率最高的位点都为胞质,说明它们都为出现几率最高的位点都为胞质,说明它们都为胞浆内蛋白,这也为今年来在溶酶体内外都发现组织蛋白酶活性提供胞浆内蛋白,这也为今年来在溶酶体内外都发现组织蛋白酶活性提供了证据。了证据。72掌握蛋白二级结构、三级结构、结构域的概念掌握蛋白二级结构、三级结构、结构域的概念了解蛋白序列分析的内容了解蛋白序列分析的内容本节要求本节要求73

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号