文档详情

KEGG数据库的使用说明

夏**
实名认证
店铺
DOCX
228.35KB
约14页
文档ID:453405260
KEGG数据库的使用说明_第1页
1/14

KEGG数据库的使用方法与介绍http://www・genome・jp/KEGG的数据KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG中有一个“专有名词”KO(KEGGOrthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签下面就首先来讲一下KEGGorthology任找一个代谢通路图,在上方有pathwaymeueIpayhwayentryIShow(Hide)description|这3个选项,点击pathwayentry,出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了在这个页面中的pathwaymap项中点击按钮状的链接Orthologtable就进入了Orthologtable如下的页面:Orthologtabl&(ko00010)-—▼Page:1T>:OrqariisnnKO0644CHK)[296]K12407(GOC)[11]K00S4S(gllc)[1108]K01S1G(GPI)[1234]hsaP31013098309926452821ptrP4&229B741291450505737923455941mccP710479698120711922659728717980mmuP152772120321527510390814751rnoP2505S250592506024385292804cfaP479-234475781489096479379611942btaP2817712S0817616576280808在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homosapiens,mcc表示Macacamulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase这一类序列和功能相似的蛋白质类(酶类)。

如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号空白则表示在该物种中不存在这种酶点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路下面我们点击3101,如下:Homosapiens(human):3101阳$Entry3101CDSsapiensGenenameHK3,HKTTI,EXK3Definitionhexokj.na3e3(whitecell}(EC:2.7.1.1}OrthologyKOOB44heKokinciae[EC:2Pathwayhsa00010Glycolysis/GluconeogenesishaaDOO51Fnact-oseand.inannDae:metabc1iamhsaC'OO^SGalactoseReLabolismhsa.3C500Sc-arch&nd3-icros=metabolism:h2a.3052Qizninoandn'Jicleo七1且三2'j.gar血皂七aholiBn■isaOC"524But-iroslnandneomycinbiosynthesishsaOllOOMstabolicpathwayshsa34910Insulinsignalingpathway30TypeIIdiabetesBi.ellitu3ClassMetabolism;CarbohydiateMetabolism;Glycolysis/Gluconeogenesis(PAPE:hsaC10310]MetaboliBH.;匚arbohydzateMetabolisni;Fruc-toseandmannosenetabolisralPATE:hsa00051]如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号),H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。

所以从Orthologtable中可以很容易地知道一张代谢通路上有哪些KO分类(酶类),并且这些酶类的成员在各物种中分配存在的情况以及特定的名称怎么看KEGG中代谢通路图Glycolysis/Gluccneocenesis-sacchacerevislae(buddingveast)[Pathwaymenu|Pathwayentry|Showdescription]比如以上这个图,方框一般就是酶,方框里面的5.422不是IP而是EC编号;小圆圈代表代谢物,你把鼠标放上去,(别放我这上面,放KEGG中去)会出现C00668的东西,C代表compound,00668是这种化合物在KEGG中的编号,一般在KEGG中数据条目都是这样的,前面一个标志,后面一个五位数编号;大的圆方块,就表示是另一个代谢图了,所以就不展开了但是:为什么这个图上有的小框框是绿色呢?(这是绿色吧?我蓝绿不分的,下同)因为这是一张特定物种(S.cere.酿酒酵母)的代谢图,蓝色的框框表示专属于这个物种在KEGG中有两种代谢图,一种是参考代谢通路图referencepathway,是根据已有的知识绘制的概括的、详尽的具有一般参考意义的代谢图,这种图上就不会有绿色的小框,而都是无色的,所有的框都可以点击查看更详细的信息;另一种就是像上面这样的属于特定物种的代谢图species-specificpathway,会用绿色来标出这个物种特有的基因或酶,只有这些绿色的框点击以后才会给出更详细的信息。

这两种图很好区分‘referencepathway在KEGG中的名字是以map开头的,比如map00010,就是糖酵解途径的参考图,而特定物种的代谢通路图开头三个字符不是map而是种属英文单词的缩写(应该就是一个属的首字母+2个种的首字母)比如酵母的糖酵解通路图,就是sce00010,大肠杆菌的糖酵解通路图就应该是eco00010吧那么:怎么找这两种图呢?(1)有下拉列表的时候,在列表选择reference或者是特定物种即可2)在pathway检索的页面http://www.genome.jp/kegg/pathway.html,如下图:是psbE其实我试了一下,若直接检索基因名称(而不是KEGG中的基因ID)sympsbE也是一样的因为我不知道KEGG中基因ID如何编制的,但是,我同时也不知道基因的名称是如何定义的比如果糖1,6-二磷酸酶Fructose1,6-biphosphatase的基因就叫fbp,我放进去能检索,但是我把有名的gal填上去就不能检索,当然这可能与基因后面的乱七八糟的序号后缀有关,比如填上gal1就能检索了,所以我真不知道基因到底怎么命名的?当然我在syn中没找到gall在sce中检索到了,这也说明了基因果然不是乱长的。

KEGG2PATHWAYBR1TEDISEASEDRUGKOGENESGENOMELIGANDDBGETSelectprefixmap|OrganismEnterrdsHebPathwayMapsKEGGPATHWAYisacollectionofmanuallydrawnpathwaymapsnewmaps^changehistory,andl^gtupdates)representingourknowledgeonthemoleujlnrintmracticiriandreaction仃etworkefor:0・GlobalMaplaMetabolifmCarbohvdrateEner口*Li口idNucleotideAminoacidOtheraminoaerdGlvcan默认的就是map,参考图,你想要什么物中的代谢图写上它的名称就好了(种属缩写),如果不知道是哪3个字母,点击organism选择即可不过你点进去也是一片空白,你要提示两个字母才会给出下拉条目)顺便问一下:怎么找基因呢?还是上面这张图,看到了吗,除了PATHWAY之外是不是还有BRITE、DISEASE..以及GENES等等,点击基因GENES,就可以查找基因了,如下图:KEGG2PATHWAYBRnEKOGENESS5DBGENOMEOrganismsEnterorg:gene(Example)s7n:ssr345t[Entry][金门电cluster.iOrthologI|ParalogIiMotif][Clwr]Gen已CatalogsKEGGGENESisacollectionofgenecatalogsforallcompletegenomesfseeupdatehistory)generatedfrompubliclyavailableresources;mostlyNCBIRefSeq.TheyaresubjecttoSSDB不过这里要按一定的格式(org:gene)输入要查找的目的基因,比如它给出的示例:syn表示物中,ssr3451表示基因ID,查找出来的基因名称依旧是上面这个图,看到KEGG2了吗?点击。

也会出现检索框,这是一个总体性地检索框,在这里面输入关键词,代谢通路也好,glycolysis也好,gal也好,化合物也好,没那么多限制,KEGG中的相关东西都会检索出来,在这里浏览一下,再进行后续检索,也是一个不错的方法当然,代谢通路图,还有其他的查看形式(比如以KO查看),以及图上可以点击,链接到这链接到那,点来点去总能点出奇怪的页面来,熟悉一下也就熟悉了,这些东西会很有用,所以我就不说了下面讲一下KEGG的自动注释功能KEGG的自动注释KEGGAutomaticAnnotationServer,KEGG的自动注释服务简称KAAS网址为http://www.genome.jp/tools/kaas/就是你提交一段蛋白质序列或者基因序列(必须是fasta格式),它自动在内部进行相似性比对,找到最相似的基因,并确定检索基因的KO分类,然后给出这些基因所在的代谢通路并以以不同的颜色标示这些基因如下图:Querysequencesonmuit^FASTA)Textdata[:Nucleotide)ISAVAS^ISGSSPTLF盘LmKPETM职9A0WLEKN汇翩■范GFVHI?FLL>DTAGARVLEN>0002KE(LYNLK3HJTE;2VSFA^AVIQGL&KNQGLFS'FH.DLFEF5LTEIDEKLKLi)FVIR5AKIL51壬iFIGDEIF^EILE灵顽海F直FT査FTSMNESDV^LELFSS-PTLaFPDFS-G^IHaQjbiLTHIAGDKPVTILTAISG-DCTS^VAH^FyGLEI-MfWIlYPRSKISPL^EKLFDTLGGHIEL3VilDGDFDAC:QZLL^TQiFDDEELKVMJGIlTSANSINISRLIAQICYYFEiV^-^LPQETRIia十TT;nFUIZFD口/ZMUVZFTTTA匚TT鼻TZUTUTU7:TyOITT亢九Thl飞耐EVnJTZPTTTHFtfZT^T3^。

下载提示
相似文档
正为您匹配相似的精品文档