华中农业大学生物信息学课件Bioinf02-2

上传人:豆浆 文档编号:48543924 上传时间:2018-07-17 格式:PPT 页数:45 大小:1.42MB
返回 下载 相关 举报
华中农业大学生物信息学课件Bioinf02-2_第1页
第1页 / 共45页
华中农业大学生物信息学课件Bioinf02-2_第2页
第2页 / 共45页
华中农业大学生物信息学课件Bioinf02-2_第3页
第3页 / 共45页
华中农业大学生物信息学课件Bioinf02-2_第4页
第4页 / 共45页
华中农业大学生物信息学课件Bioinf02-2_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《华中农业大学生物信息学课件Bioinf02-2》由会员分享,可在线阅读,更多相关《华中农业大学生物信息学课件Bioinf02-2(45页珍藏版)》请在金锄头文库上搜索。

1、第二章数 据 库库(III)生物信息学v EBI (European Bioinformatics Institute) 管理v 与GenBank收集的数据相同v 序列数据展示方式与 GenBank 不同(网页页,纯纯 文本)数据库库主页页“Text search”输输入关键词键词检检索到的条目每一条目详细详细 内容(10)ENA (European Nucleotide Archive)http:/www.ebi.ac.uk/ena/(11)DDBJ (DNA Data Bank of Japan)u 与GenBank收集的序列数据相同 数据库库主页页http:/www.ddbj.nig.a

2、c.jp/index-e.html 提供基于关键词键词 及序列的搜索服务务 打开“ARSA”输输入关键词键词检检索到的条目每一条目详细详细 内容与GenBank一致发发表文章要提供 Accession number( 在三大核苷酸数据库库中通用)EPD (Eukaryotic Promoter Database)http:/www.epd.isb-sib.ch/u 由Weizmann Institute of Science in Rehovot (Israel) 开创创u 收集数据的转录转录 起始位点(TSS)通过实验过实验 确定u 包括部分cis-element信息u 同一个基因可以具有多

3、个启动动子u 原版(EPD)包含4809条真核生物聚合酶II(eukaryotic POL II)启动动子序列u 新版(EPDnew)主要包含人类类、小鼠和果蝇蝇的大量启 动动子信息,总总数超过过20万(12)启动子数据库PlantProm (plant promoter database)u 植物启动动子数据库库(水稻、拟拟南芥)u 部分收集数据的转录转录 起始位点(TSS)通过实验过实验 确定,其他的有全长长cDNA序列支持u 包括部分cis-element信息u 最近更新是2009.02,总总共8301条植物启动动子序列u 可以完整下载载(12)启动子数据库(13)miRNA数据库Sci

4、ence 309:1522 (2005)转录转录 RNA折叠形成 pri-miRNApre-miRNAmiRNARISC携带带 有活性的miRNAmiRNA genemicroRNA (miRNA)的形成miRBase http:/www.mirbase.org/u 收集了28645条 hairpin precursor miRNA 序列(第21版,2014.6)u 来源于100个物种 u 可以通过过miRNA名称、关键词键词 、染 色体位置等信息检检索数据库库 u 分析一条DNA序列中是否可能包含 miRNA(第四章介绍绍)(13)miRNA数据库u 利用miRNA编编号或关键词检键词检 索

5、(1)在数据库库主页页点击击“searching”在“Search miRBase”网页页的“By miRNA identifier or keyword”栏栏目输输入miRNA编编号, 点击击“提交查询查询 内容”检检索结结果目录录查查看详细详细 信息u 利用染色体位置检检索miRNA(2)在数据库库主页页点击击“searching”在“Search miRBase”网页页的“By genomic location”栏栏目选择选择 物种和染色体,输输入染色体上 的核苷酸位置范围围(如1000至1000000),点击击 “Get sequences”检检索结结果目录录查查看详细详细 信息u 检

6、检索miRNA群(cluster)(3)在数据库库主页页点击击“searching”在“Search miRBase”网页页的“For clusters”栏栏目 选择选择 物种,输输入希望查询查询 的miRNA之间间的距离( 核苷酸数目),点击击“Get clusters”检检索结结果目录录批量获获取mature miRNA序列:在结结果目录录网页页的 “Fetch”列选择选择 miRNA,在该该网页页的底部选择选择 “Mature sequence”,点击击“Fetch Sequences”第二章数 据 库库(IV)生物信息学2、蛋白质数据库u 由PIR、EBI 和SIB于2002年创办创办

7、 ,统统一了 PIR、 TrEMBL和Swiss-Prot三个蛋白质质数据 库库u 分为为两个部分:来源于实验实验 的有详细详细 注释释的 序列(SwissProt)和自动动注释释序列( TrEMBL)u 与100多个数据库库相互参照(cross-reference)u 可用关键词键词 (Text search)和序列比对对( BLAST similarity search)进进行检检索(1)UniProthttp:/www.uniprot.org/ UniRef100:非冗余的UniProt蛋白质序列 UniRef90:聚类UniRef100中一致性超过90%且80% 重叠的蛋白质,取最长的

8、一条(序列数压缩58%) UniRef50:聚类UniRef90中一致性超过50%且80% 重叠的蛋白质,取最长的一条(序列数压缩79%)UniProt蛋白质数据库的结构在数据库库主页页搜索框选择选择 “Protein Knowledgebase”库库,使用关键词检键词检 索结结果页页面,reviewed (Swiss-Prot) ,unreviewed (TrEMBL)Browse by taxonomy, keyword, gene ontology, enzyme class or pathway条目详细详细 内容(1)UniPROT(2)PIR (Protein Information

9、 Resource)http:/pir.georgetown.eduu 由National Biomedical Research Foundation 创办创办u 信息整合的蛋白质质序列数据库库(iProClass) ,内容/编编号与UniProtKB相同,但额额外提供 到超过过160个数据库库的链链接u 蛋白质质序列分类类数据库库(PIRSF),提供不 同层级层级 的蛋白质质家族分类类(Superfamily、 Homeomorphic Family和Homeomorphic Subfamily)(2)PIR (Protein Information Resource)u 检检索某一蛋白质

10、质的注释释信息数据库库主页页“Search/Analysis”菜单单 “Text Search” 选择选择 数据库库“iProClass”后输输入关 键词键词 或注册号 检检索结结果列表 查查看详细详细 内 容u 检检索某一蛋白质质分类类的信息数据库库主页页“Search/Analysis”菜单单 “Text Search” 选择选择 数据库库“PIRSF”后输输入关键键 词词或注册号 检检索结结果列表 查查看详细详细 内容(3)PRF (Protein Research Foundation)https:/www.prf.or.jp/index-e.htmlu 由日本的 Protein Re

11、search Foundation 创办创办u 已发发表在杂杂志上的蛋白质质序列u 修饰饰位点、SS键键等u 两月更新一次(4)PDBSTR (Re-Organized Protein Data Bank)http:/www.genome.jp/dbget-bin/www_bfind?pdbstr u 蛋白质质序列和二级结级结 构u 碳结结构(5)Prositehttp:/www.expasy.org/prositeu 蛋白质质家族u 结结构域3、结构数据库(1)PDB (Protein Data Bank)http:/www.rcsb.orgu 由 Brookhaven National L

12、aboratories 创办创办v 蛋白质质v 核酸v 其它u 117651个结结构图图(2016.4.11)u 可通过过 关键词键词 或BLAST 系统检统检 索(第四章介绍绍)TotalYearlyPDB Content Growth(1) PDB (Protein Data Bank)u 使用关键词键词 或注册号检检索PDB数据库库主页页“Search”框 输输入关键词键词 或注册号 检检 索结结果列表 查查看详细详细 内容(2)NDB (Nucleic Acid Database)http:/ndbserver.rutgers.edu 包含8,089个核酸分子的结结构(2016.3 )

13、(3)PDIdb (Protein-DNA Interface Database)http:/melolab.org/pdidb DNA-蛋白质质复合体的 X 射 线线衍射结结构及分类类4、酶和代谢数据库KEGG (Kyoto Encyclopedia of Genes and Genomes) u 各种代谢谢、遗传遗传 等路径图图u 可检检索参于各种路径的基因u 检检索Metabolism(1)KEGG主页页http:/www.genome.ad.jp/kegg/ 点击击“KEGG PATHWAY”“PATHWAY”网页页点击击任一代谢谢路径(Metabolism) ,如糖酵解/糖原异生途径

14、(Glycolysis/Gluconeogenesis)u 检检索Genetic Information Processing(2 )KEGG主页页点击击“KEGG PATHWAY”“PATHWAY”网页页点击击任何遗传遗传 信息( Genetic Information Processing)路径, 如 Protein export 路径可以查查看参加这这一路径蛋白质质的信息KEGG数据库库u 检检索Environmental Information Processing(3)KEGG主页页点击击“KEGG PATHWAY”“PATHWAY”网页页点击击任何Environmental Inf

15、ormation Processing 路径,如 MAPK signaling pathway 路径可以查查看与这这一路径相连连的其它信号路 径或参加这这一路径的蛋白质质信息KEGG数据库库u 检检索Cellular Processes(4)KEGG主页页点击击“KEGG PATHWAY”“PATHWAY”网页页点击击任何Cellular Processes 路径,如 Cell cycle 路径可以查查看与这这一路径相连连的其它信号路 径或参加这这一路径的蛋白质质信息KEGG数据库库(2)PKR (Protein Kinase Resource)http:/pkr.genomics.purdu

16、e.edu/pkr/多种检检索内容u 已知蛋白激酶的序列比较较u 蛋白激酶分类类u 蛋白激酶的三维结维结 构u 与疾病相关的蛋白激酶u 其它内容5、物种分类数据库u 物种分类类界(Kingdom) 门门(Phylum) 纲纲(Class) 目(Order) 科(Family) 属(Genus) 种(Species) 每一分类等级下可加设亚级 (Sub-),如亚门、亚纲、亚科等 。 每一分类等级上可加设总级 (Super-),如总纲、总目、总科等 。动物界(Animal) 脊索动物门(Chordata) 脊椎动物亚门(Vertebrata) 哺乳纲(Mammalia) 啮齿目(Rodentia) 鼠科(Muridae) 小家鼠属(Mus) 小家鼠种(musculus) Mouse:Mus musculushttp:/www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.ht

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号