义-数据库检索-生物医学

上传人:tia****nde 文档编号:69083991 上传时间:2019-01-12 格式:PPT 页数:53 大小:1.86MB
返回 下载 相关 举报
义-数据库检索-生物医学_第1页
第1页 / 共53页
义-数据库检索-生物医学_第2页
第2页 / 共53页
义-数据库检索-生物医学_第3页
第3页 / 共53页
义-数据库检索-生物医学_第4页
第4页 / 共53页
义-数据库检索-生物医学_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《义-数据库检索-生物医学》由会员分享,可在线阅读,更多相关《义-数据库检索-生物医学(53页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据库检索,任间 renjianbiocuckoo.org,The CUCKOO Workgroup,NCBI数据资源,Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO:基因表达谱数据库。收集存储微阵列基因表达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含已确定基因和EST。每个簇包含唯

2、一的非冗余的基因序列、表达的组织类型和基因图谱位点。 UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色体图形 GDS: GEO的基因表达实验与生物芯片数值结果数据库,Entrez,检索规则,逻辑运算符(大写): AND ,OR,NOT

3、 运算过程由左至右,()部分优先 空格分隔默认逻辑关系为 AND 多个单词短语加双引号 模糊检索使用 * 用 限定字段,如限定基因名称为ATG1的检索 :ATG1GENE,数据库使用实例,序列数据查询实例,某天,Prof. Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(表型,phenotype),通过实验的方法(例如,酵母双杂交),发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(genotype):,CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGG

4、CTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAA

5、AGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC,问题一:这是哪个基因?,NCBI: BLAST,nucleotide blast,Megablast: 找基因序列,输入序列,提交序列,NM_001168.2,Gene info:基因信息,BIRC5(survivin),Gene info: 17号染色体,功能注释:Gene Ontology,结论一,1. 该基因为人的BIRC5(survivin)基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2; 2. 初步的功能分析:细胞周期,casp

6、ase酶的抑制因子,等等。,问题二:编码的蛋白质序列是怎样的?,NM_001168.2,获取蛋白质的序列信息,NP_001159.2:142aa,结论二,人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2,问题三: 有没有保守的功能结构域 (domain)?,获取FASTA序列,FASTA格式的序列,find conserved domains,填入蛋白质的FASTA序列,BIR domain,结论三,Survivin具有保守的功能结构域BIR,问题四:它的功能是怎样的?,UniProt: 蛋白质数据库,在人中做BLAST搜索,O15392,BIRC5的蛋白质信

7、息,功能注释,结论四:功能分析,1. 在瘤形成过程中可能起一定作用; 2. 阻碍G2/M期的细胞编程性凋亡; 3. Chromosomal passenger complex (CPC)的成员之一。 细胞亚定位:胞质,核。 ,问题五:它在真核生物中保守吗?,ExPASy Blast,在酵母中进行序列比对,酵母BIR1: P47134,酵母BIR1的信息,结论五:,人的Survivin在酵母中的同源物可能是BIR1。,问题六:有没有三级结构信息?,PDB:三级结构数据库,PDB的三级结构信息,用Jmol显示三级结构,PDB的三级结构信息,Raswin: 三级结构显示,总结,现在,Prof. Ge

8、ne知道了: 1. 该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2; 2. 人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2 3. Survivin具有保守的功能结构域BIR 4. Survivin的细胞亚定位:胞质,核,其功能有: (1) 在瘤形成过程中可能起一定作用; (2) 阻碍G2/M期的细胞编程性凋亡; (3) Chromosomal passenger complex (CPC)的成员之一。等等。 5. 人的Survivin在酵母中的同源物可能是BIR1。 6. S

9、urvivin的三级结构已知,在PDB中的标识符为1E31。,作业,某天,Prof. Gene在小鼠(Mus musculus)中又发现了一个与有丝分裂相关的基因,通过DNA测序,得到部分序列:,GATGAGCTGCTTATCCTACAACGAGAAGTCGGACATCTGGTCCTTGGGCTGCCTGCTGTATGAGCTGTGTGCACTAATGCCTCCCTTTACAGCTTTCAACCAAAAAGAGCTAGCTGGGAAAATCAGGGAAGGGAGGTTCAGGCGCATCCCCTACCGCTACTCTGATGGCTTGAATGACCTCATCACTCGGATGCTGAATTTA

10、AAGGACTACCATCGACCTTCAGTGGAAGAAATTCTGGAGAGCCCTTTGATAGCAGACTTGGTTGCAGAAGAGCAAAGGAGAAATCTGGAGAGGAGAGGACGGCGCTCAGGCGAGCCTTCGAAGCTGCCGGACTCCAGCCCTGTGCTGAGCGAGCTCAAGTTGAAGGAAAGGCAACTGCAGGATCGAGAGCAAGCACTCAGAGCTCGGGAGGACATCCT,问题:,1. 这个基因在小鼠中是哪个基因?基因的标识符是什么?这个基因的在基因组上的定位是怎样的? 2. 这个基因在人中的同源物是哪一个?标识符是什么? 3. 在人中,这个基因编码的蛋白质是什么?具有什么样的功能?细胞亚定位在何处?这个基因是一个酶吗,什么酶?具有什么样的功能结构域? 4. 这个基因在酵母中保守吗?如果保守,哪个基因是人中的同源物? 5. 这个基因在人中的同源物,编码的蛋白质有3级结构的信息吗?如果有,给出在PDB中的标识符。,作业要求,发信至 renjianbiocuckoo.org 信件名称:学号+姓名 答题内容使用文本文件(TXT),不要使用Word文件或其他格式。 文件名:学号+姓名.TXT,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号