实验四蛋白质序列、结构的获取和显示

上传人:M****1 文档编号:567414223 上传时间:2024-07-20 格式:PPT 页数:57 大小:11.16MB
返回 下载 相关 举报
实验四蛋白质序列、结构的获取和显示_第1页
第1页 / 共57页
实验四蛋白质序列、结构的获取和显示_第2页
第2页 / 共57页
实验四蛋白质序列、结构的获取和显示_第3页
第3页 / 共57页
实验四蛋白质序列、结构的获取和显示_第4页
第4页 / 共57页
实验四蛋白质序列、结构的获取和显示_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《实验四蛋白质序列、结构的获取和显示》由会员分享,可在线阅读,更多相关《实验四蛋白质序列、结构的获取和显示(57页珍藏版)》请在金锄头文库上搜索。

1、复旦大学实验四:蛋白质序列、结构的获取和显示实验四:蛋白质序列、结构的获取和显示杜杜 娟娟基因与蛋白质组学数据分析基因与蛋白质组学数据分析实验项目实验项目四:蛋白质序列、结构的获取和显示四:蛋白质序列、结构的获取和显示一、实验目的和要求:掌握蛋白质序列数据库Uniprot的查询方法及格式特点掌握蛋白质结构数据库PDB的及格式特点掌握蛋白质结构显示软件Pymol的使用2UniProt:Universal Protein Resource 收录蛋白质序列目录最广泛、功能注释最全面的数据库;包含三个子库:UniProtKB(UniProt Knowledgebase)UniRef(UniProt R

2、eference Clusters)UniParc(Uniprot Archive)一一UniProt数据库数据库1. 1. 简介简介32.数据来源European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)4UniProt的网址:的网址:http:/www.uniprot.org/53.数据查询数据查询 Unipr

3、ot检索号,包括6个字符串,可由大写字母AZ和数字09组合而成。 也可以用关键词检索 6检索演示例例1:查查询询草草履履虫虫细胞周期蛋白依赖的蛋白激酶(CDK2)的结构数据的结构数据(1)登陆Uniprot网站 http:/www.uniprot.org/(2)在搜索栏选中“Protein knowledgebase(UniProtKB)” ,在文本框中输入“Paramecium tetraurelia CDK2”,单击Site Search按钮,出现结果。789101112与其他数据库的链接与其他数据库的链接13144. UniProt数据格式IDQ9XYV1_PARTEUnreviewed

4、;301AA.ACQ9XYV1;DT01-NOV-1999,integratedintoUniProtKB/TrEMBL.DT01-NOV-1999,sequenceversion1.DT21-MAR-2012,entryversion71.DESubName:Full=Cyclin-dependentproteinkinaseCdk2;GNName=CDK2;OSParameciumtetraurelia.OCEukaryota;Alveolata;Ciliophora;Intramacronucleata;OCOligohymenophorea;Peniculida;Parameciida

5、e;Paramecium.OXNCBI_TaxID=5888;头部区头部区序列名称序列名称序列编号序列编号序列来源的物种名序列来源的物种名序列来源的物种序列来源的物种学名和分类学位学名和分类学位物种分类号物种分类号序列简单说明序列简单说明15引文区引文区RN1RPNUCLEOTIDESEQUENCE.RCSTRAIN=51S;RXMEDLINE=99448661;PubMed=10519216;RXDOI=10.1111/j.1550-7408.1999.tb06065.x;RAZhangH.,BergerJ.D.;RTAnovelmemberofthecyclin-dependentkina

6、sefamilyinParameciumRTtetraurelia.;RLJ.Eukaryot.Microbiol.46:482-491(1999).评论区评论区CC-CCCopyrightedbytheUniProtConsortium,seehttp:/www.uniprot.org/termsCCDistributedundertheCreativeCommonsAttribution-NoDerivsLicenseCC-相关文献编号或递交序列的注册信息相关文献编号或递交序列的注册信息序列注释信息序列注释信息16交叉引用数据库区交叉引用数据库区DREMBL;AF126147;AAD343

7、54.1;-;Genomic_DNA.DRHSSP;P24941;1OIQ.DRProteinModelPortal;Q9XYV1;-.DRGO;GO:0005524;F:ATPbinding;IEA:UniProtKB-KW.DRGO;GO:0004674;F:proteinserine/threoninekinaseactivity;IEA:InterPro.DRInterPro;IPR011009;Kinase-like_dom.DRInterPro;IPR000719;Prot_kinase_cat_dom.DRInterPro;IPR017441;Protein_kinase_ATP

8、_BS.DRInterPro;IPR002290;Ser/Thr_dual-sp_kinase_dom.DRInterPro;IPR008271;Ser/Thr_kinase_AS.DRPfam;PF00069;Pkinase;1.DRSMART;SM00220;S_TKc;1.DRSUPFAM;SSF56112;Kinase_like;1.DRPROSITE;PS00107;PROTEIN_KINASE_ATP;1.DRPROSITE;PS50011;PROTEIN_KINASE_DOM;1.DRPROSITE;PS00108;PROTEIN_KINASE_ST;1.17序列区KWATP-b

9、inding;Cyclin;Kinase;Nucleotide-binding;Transferase.SQSEQUENCE301AA;34675MW;E839F1A5EA0D5CB5CRC64;MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGVPSTAIREISLLKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKKFINQMIQALNYCHQNRVIHRDLKPQNILVDIKQQNTQIADFGLARAFGLPLKTYTHEVITLWYRAPEILLGQRQYSTPVDIWSL

10、GCIFAEMAQKRPLFCGDSEIDQLFKIFKIMGTPKESTWPGVSTLPDFKSTFPRWPTPTNPAATLGKDITNLCPLGLDLLSKMITYDPYARITAEEALKHAYFDELNN/与序列相关的关键词与序列相关的关键词氨基酸统计数氨基酸统计数18DNA代码氨基酸代码19FASTA文件格式文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1ID 号号名称,基本性名称,基本性质简要要说明明201.在Uni

11、prot中查询拟南芥的光敏色素phyE编码蛋白的详细信息,阅读序列格式的解释,列出共包含哪几个部分?标出头部区主要字段的含义。2.在Uniprot中查询(1)拟南芥油菜素内酯受体gibberellin receptorGID1C 、 (2)水稻独角金内酯水解酶strigolactone hydrolase D14的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的mRNA检索号(类似于这样的格式N*_*)、GeneID号。作作业业21二 蛋白质结构数据库PDB Protein DataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 http:/www

12、.rcsb.org/pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 。22PDB数据库(proteindatabank)1.简介简介 美国Brookhaven实验室1971年建立的大分子结构数据库PDB 蛋蛋白白质质晶晶体体结结构构资资料料数数据据库库(Protein Data Bank)。 PDB数据库的维护由结构生物信息学研究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。232.

13、数据来源数据来源通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。 主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 243.数据统计数据统计 截止2013年11月,PDB数据库已含有95644 个结构数据,其中约92.5%是蛋白质的结构。 25264.数据查询数据查询 PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。 PDB和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。 27检索演示例例1:查询:查询人类泪液载脂蛋白的结构数据的结构数据(

14、1)登陆PDB网站 http:/www.rcsb.org/pdb/(2)在上方的搜索栏选中“Everything” ,在文本框中输入“HUMAN TEAR LIPOCALIN”,单击Site Search按钮,出现结果。28第一步:第一步: 输输入入关关键键字字“HUMAN HUMAN TEAR LIPOCALIN” TEAR LIPOCALIN” 也可输入也可输入IDID号号 29第二步:第二步: 选选择择人人类类泪泪液液载载脂脂蛋蛋白白1XKI 1XKI 30数据查看:(3)分别单击标签3D view,Sequence,Annotations,Seq.Similarity, 3D Simi

15、larity, Literature, Biol.& Chem., Methods, Geometry观察数据信息。(4)回到Summary标签,在右侧的BiologicalAssembly区域可以观察蛋白的三维结构。(5)单击右侧目录中的Download Files下载不同格式和内容的文件;或下载FASTA序列文件;也可下载PDB文件(1XKI.pdb)。31第第三三步步:观观察察数数据据信信息息 1XKI1XKI3233第四步:第四步: 1XKI1XKI结构展示图结构展示图 3435下载下载PDB结结构文件构文件365.数据结构PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构

16、、二级结构和原子坐标等信息。 每条记录有两种序列信息,一种是显式序列信息(explicit sequence),一种是隐式序列信息(implicit sequence)。37 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 38PDB文本文件,文本文件,用写字板打开用写字板打开标标题题部部分分分子类别分子类别转运蛋白转运蛋白 该文件的公该文件的公布日期布日期 该化合物该化合物的的pdb代代码码 该化合物的该化合物的来源来源 结构测定者结构测定者名字名字 REMARK是此是此p

17、db文件的参文件的参考书目、最大分辨率、注解考书目、最大分辨率、注解等等 3940一一级级结结构构杂杂因因子子41二二级级结结构构连连接接注注释释晶晶胞胞特特征征及及坐坐标标变变换换42连连通通性性部部分分坐坐标标部部分分1-6“ATOM或或HETATM”7-11原原子子序序列列号号13-16原原子子名名称称18-20残残基基名名22链链标标识识符符23-26残残基基序序列列号号31-38X坐坐标标39-46Y坐坐标标47-54Z坐坐标标55-60位位置置61-66温温度度因因子子79-80原原子子带带的的电电荷荷77-78元元素素符符号号43三 结构显示软件-PyMOL简介http:/www

18、.pymol.org/All指所有的对象,指所有的对象,3ODU指刚指刚才打开的文件,才打开的文件,(sele)是选择的是选择的对象对象按钮按钮A:代表对这个对象的各种代表对这个对象的各种action,S:显示这个对象的某种样式,:显示这个对象的某种样式,H:隐藏某种样式,:隐藏某种样式,L:显示某种:显示某种label,C:显示的颜色:显示的颜色44点击点击all中的中的H,选择,选择everything,隐藏所有,隐藏所有点击点击3ODU中的中的S,选择,选择cartoon,以,以cartoon形式显示蛋白质形式显示蛋白质点击点击3ODU中的中的C,选择选择byss,以二级结构分配颜色,以

19、二级结构分配颜色,选择选择点击右下角的点击右下角的S,窗口上面出现蛋白质氨基酸序列,找到,窗口上面出现蛋白质氨基酸序列,找到1164位位ITD,是,是配体配体45点击选择点击选择ITD,此时,此时sele中就包含中就包含ITD这个残基,点击(这个残基,点击(sele)行的)行的A,选择,选择renameselection,窗口中出现,窗口中出现更改更改sele为为IDT,点击(,点击(IDT)行的)行的S选择选择sticks,点击,点击C,选择,选择byelement,选择,选择,调整窗口使此分子清楚显示。调整窗口使此分子清楚显示。46IDT行点击行点击A选择选择find,选择,选择polar

20、contacts,再根据需要选择,这里选择,再根据需要选择,这里选择tootheratomsinobject,分子显示窗口中出现几个黄色的虚线,这就是氢键的对象,点击这一行的分子显示窗口中出现几个黄色的虚线,这就是氢键的对象,点击这一行的C,选择,选择red,把氢键显示为红色。,把氢键显示为红色。47接着再显示跟接着再显示跟IDT形成氢键的残基形成氢键的残基点击点击3ODU行的行的S,选择,选择lines,显示出所有残基的侧链,使用鼠标转动蛋,显示出所有残基的侧链,使用鼠标转动蛋白质寻找与白质寻找与IDT以红色虚线相连的残基,分别点击选择这些残基。注意以红色虚线相连的残基,分别点击选择这些残基

21、。注意此时此时selecting要是要是residures484950515253543.在PDB结构数据库中查询(1)拟南芥茉莉酸受体、(2)拟南芥油菜素内酯受体、(3)水稻独角金内酯水解酶的结构,每个蛋白共搜索到几个PDB结构?用Pymol软件观察下载到的结构,对每个蛋白的几个结构有何区别?4.利用Pymol,做出拟南芥茉莉酸受体与茉莉酸结合的作用图,背景白色,分子显示成棍状模型,蛋白显示为cartoon模型。作作业业55实验报告到网络教学平台-基因与蛋白质组学数据分析B2100029-教学材料-实验课件下载基因与蛋白质组学数据分析实验报告模版将上述问题答案整理到实验报告中,正反打印放在1张纸上(不超过1张),下次实验课上交。56复旦大学谢谢大家!谢谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号