GenBank数据库检索及其应用

上传人:jiups****uk12 文档编号:39261415 上传时间:2018-05-13 格式:DOC 页数:13 大小:38KB
返回 下载 相关 举报
GenBank数据库检索及其应用_第1页
第1页 / 共13页
GenBank数据库检索及其应用_第2页
第2页 / 共13页
GenBank数据库检索及其应用_第3页
第3页 / 共13页
GenBank数据库检索及其应用_第4页
第4页 / 共13页
GenBank数据库检索及其应用_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《GenBank数据库检索及其应用》由会员分享,可在线阅读,更多相关《GenBank数据库检索及其应用(13页珍藏版)》请在金锄头文库上搜索。

1、GenBankGenBank 数据库检索及其应用数据库检索及其应用 x xGenBank 数据库数据库检索及其应用应用 Entrez 检索功能 重庆医科大学图书馆 李 轶 简介 GenBank 数据库数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数数 据库据库. GenBank 数据库数据库的数据来源有三种: 1,直接来源于测序工作者提交的序列; 2,与其它数据机构协作交换的数据; 3,美国专利局提供的专利数据. NCBI 网站网址: http:/www.ncbi.nlm.nih.gov GenBank 和 PubMed(序列数据)检索的比较: 1,GenBank 的检索结果

2、是序列及其注释信息; PubMed 的检索结果是与序列数据相关的文献信息. 2,GenBank 数据更新早于 PubMed,GenBank 数据库数据库的检全率高于 PubMed. 3, GenBank 可对序列数据进行限制检索,而 PubMed 只能对文献,杂志,作者等进 行限制检索,因而 GenBank 数据库数据库的检准率也高于 PubMed. 检索界面 简介 基本检索输入框 基本检索界面: 执行检索按钮 基本检索输入框 基本检索界面: rasGENE 点击进入跨库检索 跨库检索界面: rasGENE 执行检索按钮 跨库检索界面: 点击进入 GenBank 数据库数据库 GenBank

3、数据库数据库界面: GenBank 数据库数据库界面: 点击进入核苷酸序列数据库数据库检索界面 GenBank 数据库数据库界面: 特征栏提供 辅助检索功能 核苷酸序列数据库数据库检索界面: 核苷酸序列数据库数据库检索界面:简介 检索界面 基本检索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 (二)特殊标志符检索 (五)范围检索 (三)序列长度检索 (四)分子重量检索 简介 检索界面 基本检索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 检索限定词: 1,基因名称的检索限定词:GENE 2,生物体名称的检索限定词:ORGN 3,作者姓名的检索限定词:AUTH 简介 检索界面 基本检

4、索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 (二)特殊标志符检索 特殊标志符的格式(核酸序列) : 2,GenBank/EMBL/DDBJ 序列接受号: (1)1 个字母+5 个阿拉伯数字 e.g.:U12345 (2)2 个字母+6 个阿拉伯数字 e.g.:AY123456,Af123456 1,序列辨认号(GI):一串阿拉伯数字 e.g.:6995995 (1)mRNA 记录(NM_*): e.g.:NM_000492 (2)基因组 DNA 重叠群(NT_*): e.g.:NT_000347 (3)完整的基因组或染色体(NC_*): e.g.:NC_000907 (4)基因组的局

5、部区域(NG_*): e.g.:NG_000019 (5)从人类基因组序列注释,加工得到的序列模型记录(XM,XP,or XR_*): e.g.:XM_000483 特殊标志符的格式(核酸序列): 3,RefSeq(Reference Sequence)序列接受号: 特殊标志符的格式(核酸序列): 4 , PDB 序列接受号:1 个阿拉伯数字+3 个字母 e.g.:1TUP序列接受号的检索限定词为 ACCNorACCESSION AF123456ACCN 简介 检索界面 基本检索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索 1510SLEN 序列

6、长度的检索限定词:SLEN 简介 检索界面 基本检索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索 (四)分子重量检索 2009MOLWT 分子重量的检索限定词:MOLWT 简介 检索界面 基本检索功能 (一)名称,作者姓名,截词检索,布尔逻辑运算 (二)特殊标志符检索 (五)范围检索 (三)序列长度检索 (四)分子重量检索 范围检索:中间用冒号连接 1,序列接受号范围检索: AF114696:AF114714ACCN 2,序列长度范围检索: 3000:4000SLEN 3,分子重量范围检索: 2002:2009MOLWT 4,日期范围检索: 20

7、05/01:2006/09/26MDATorPDAT 简介 检索界面 基本检索功能 特征栏辅助检索 限制检索(Limits) 预检索/索引检索(Preview/Index) 检索史管理(History) 剪贴板管理(Clipboard)详细匹配过程(Details) 限制检索 预检索/索引检索 检索史管理 剪贴板管理 详细匹配过程 简介 检索界面 基本检索功能 特征栏辅助检索 限制检索(Limits) 限制检索界面: 限制检索界面: 核苷酸序列数据库数据库分为三个子数据库数据库: EST :表达序列标记数据库数据库 GSS :基因组测序序列数据库数据库 CoreNucleotide :包含所有

8、未被以上两个子数据库数据库收录的核苷酸序列 核苷酸序列数据库数据库检索界面: 核苷酸序列数据库数据库检索界面: 限制检索界面: 限制检索界面: 检索结果显示界面: 限制检索范围 限制检索(Limits): 限制检索范围 ras 排除某种类型的序列 限制分子类型 限制分子类型 限制基因位点 限制基因位点 限制序列片段的显示 限制序列片段的显示 限制数据来源 限制数据来源 限制数据修订日期 限制数据修订日期 简介 检索入口 基本检索功能 特征栏辅助检索 限制检索(Limits) 预检索/索引检索(Preview/Index) 预检索/索引检索界面:hepatitis b 索引检索输入框 索引检索按

9、钮 索引检索按钮 序列特性关键词索引 rasGENE 序列特性关键词索引 简介 检索界面 基本检索功能 特征栏辅助检索 限制检索(Limits) 预检索/索引检索(Preview/Index) 检索史管理(History) 剪贴板管理(Clipboard) 详细匹配过程(Details) penicillin-binding mycobacterium tuberculosis #8 AND #4 penicillin-binding AND mycobacterium tuberculosisORGN 简介 检索入口 基本检索功能 特征栏辅助检索 检索结果的显示 检索结果显示界面: 选择检索

10、结果的显示格式 选择检索结果的显示格式 选择检索结果的显示格式 摘要格式: 联接 Genbank 格式: Genbank 格式: Genbank 格式: Genbank 格式: Genbank 格式: Genbank 格式: Genbank 格式: Genbank 格式: GenBank 记录中特性表中的主要关键词: 增强子 enhancer 无法用信号特性关键词描述的信号序列 misc_signalRNA 转录本的剪切识别位点 polyA_signal 已识别为基因或已命名的序列区域 gene 核糖体结合位点 RBS 修饰过的核苷酸 modified_base 真核启动子的 GC 盒 GC_

11、signal 包含稳定突变的序列 variation 原核启动子的 Pribow 盒 -10_signal 该序列对以前的版本做过修订 old_sequence 原核启动子中的-35 框 -35_signal 序列不能确定的区域 unsure 真核启动子的 TATA 盒 TATA_signal 同一序列在不同的研究中在位点或区域上有差异 conflict 真核启动子上游的 CAAT 盒,与 RNA 结合相关 CAAT_signal 序列特性无法用特性表关键词描述的序列 misc_difference 转录起始区 promoter 生物学特性无法用特性表关键词描述的序列 misc_feature

12、 解 释 关键词 解 释 关键词 加工和修饰 rRNA 的小核 RNA snoRNA 3非翻译区 外显子 3UTR exon 小核 RNA snRNA5非翻译区 5UTR 解 释 关键词 解 释 关键词 小细胞质 RNA scRNA 前体转录本中被剪切掉的 3端序列 3 clip 转运 RNA tRNA 前体转录本中被剪切掉的 5端序列 5clip 核糖体 RNA rRNA 信使 RNA mRNA RNA 转录本的多聚腺苷酸化位点 polyA_site 前体 RNA precursor_RNA 内含子 intron 初始转录本 prim_transcript 编码成熟肽的序列 mat_pept

13、ide 无法用 RNA 关键词描述的转录物或 RNA 产物 misc_RNA 转运蛋白编码序列 transit_peptide 双链 DNA 复制起始区 rep_origin 编码信号肽的序列 sig_peptide 转录终止序列 terminator 蛋白质编码序列 CDSCDS 与转录终止有关的序列 attenuator 通过重组所消除的 DNA iDNA基因组中所包含的重复序列 repeat_region 无法用重组特性关键词描述的重组事件 misc_recomb 编码免疫球蛋白的可变区的序列 V_ segment 测序标签位点 STSSTS 编码免疫球蛋白的可变区 N 末端的序列 V_

14、 region 蛋白质结合区 protein_bind 免疫球蛋白重链的开关区 S_ region 复制,转录的引物结合位点 primer_bind 插入重排免疫球蛋白片段间的核苷酸 N_ region 无法描述的核酸序列结合位点 misc_binding 免疫球蛋白重链,轻链以及 T 细胞 , 的结合链 J_ segment 卫星重复序列 Satellite 免疫球蛋白重链的可变区, T 细胞受体 链 D_segment 长末端重复序列 LTR 免疫相关蛋白上的不变区 C_region 单个的重复元件 repeat_unit immunoglobulin_related 解 释 关键词 解

15、释 关键词 线粒体中 DNA 中的取代环 D_loop 发夹结构 stem_loop 无法用结构关键词描述的核酸序列高级结构或构型 misc_structure解 释 关键词 解 释 关键词 GenBank 记录中特性表中的限定词: 其他数据库数据库信息的交叉索引号 /db_xref= 获得序列的细胞类型 /cell_type= DNA 复制方向 /direction= 已被引用的参考文献数 /citation= 序列直接从环境材料中获得而没有指明来源物种 /environmental_sample= 获得序列的克隆文库 /clone_lib= DNA 样本的来源国 /country= 嵌合范

16、围 /bound_moiety= 相对于序列第一个碱基,编码序列密码子的偏移量 /codon_start= 给定基因的等位基因 /allele= 含 义 限定词 含 义 限定词 序列产物的酶学编号 /EC_number= 获得序列的细胞器 /organelle= 指出与参考密码子不同的密码子 /codon= 评论及附加信息 /note= 序列编码产物的名称 /product= 如果序列是 DNA 并来源于免疫球蛋白家族,则表示该序列来源于未重排 DNA /germline tRNA 反义密码子的位置及它所编码的氨基酸 /anticodon= 序列来源于某种插入元件/insertion_seq= 获得序列的细胞系 /cell_line= 序列来源的生物个体 /isolate= 获得序列的染色体 /chromosome= 为扩增序列来源物种所用的实验室宿主 /lab_host= 获得序列的克隆子 /clone= 指明 DNA 来源于染色体分化的大核期 /macronuclear 获

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号