Blast软件及常用数据库介绍

上传人:飞*** 文档编号:48594886 上传时间:2018-07-17 格式:PPT 页数:38 大小:6.24MB
返回 下载 相关 举报
Blast软件及常用数据库介绍_第1页
第1页 / 共38页
Blast软件及常用数据库介绍_第2页
第2页 / 共38页
Blast软件及常用数据库介绍_第3页
第3页 / 共38页
Blast软件及常用数据库介绍_第4页
第4页 / 共38页
Blast软件及常用数据库介绍_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《Blast软件及常用数据库介绍》由会员分享,可在线阅读,更多相关《Blast软件及常用数据库介绍(38页珍藏版)》请在金锄头文库上搜索。

1、BLAST软件及常用数据库介绍制作人:faneds*1blast软件及常用数据库介绍BLAST的概述:Blast,全称Basic Local Alignment Search Tool ,即“基于局部比对算法的搜索工具” ,能够实现 比较两段核酸或者蛋白序列之间的同源性的功能 ,具有较快的比对速度和较高的比对精度,适用 于多种序列比对的情况,在常规双序列比对分析 中应用最为广泛。Date2blast软件及常用数据库介绍BLAST的种类nBlastp :蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。nBlastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列,再与蛋 白库做比对。nBl

2、astn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。nTblastn:蛋白序列对核酸库的比对,将库中的核酸序列翻译成蛋白序列, 比对蛋白序列的同源性。nTblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成 蛋白序列,然后对蛋白序。 Blast是一个集成的程序 包,通过调用不同的比 对程序,blast实现了五 种可能的序列比对方式 Date3blast软件及常用数据库介绍BLAST资源 NCBI主站点:http:/www.ncbi.nlm.nih.gov/BLAST/ (网络版)ftp:/ftp.ncbi.nlm.nih.gov/blast/ (单机版)其他站点:ht

3、tp:/ 机版BLAST软件?STEP1下载软件获取数据库Date5blast软件及常用数据库介绍举例演示Blast程序的下载地址: ftp:/ftp.ncbi.nlm.nih.gov/blast/executables/release/2.2. 9/blast-2.2.9-ia32-win32.exe下载完后,blast-2.2.9-ia32-win32.exe为自解压文件, 双击运行后,在当前目录中会释放许多程序。双击后Date6blast软件及常用数据库介绍获取数据库登入NCBI网站:http:/www.ncbi. nlm.gov/登入NCBI网站:http:/www.ncbi. nlm

4、.gov/登入NCBI网站:http:/www.ncbi. nlm.gov/点击Date&SoftwareDate7blast软件及常用数据库介绍获取数据库BLAST数据库点击nt.gz为核酸数据库nr.gz为非冗余数据库Month.nt.gz为最近一个月 的核酸数据库右击需要下载的数据库,点击另 存为Date8blast软件及常用数据库介绍如何在windows操作系统下安装使用本 地BLAST软件?STEP2用Blast程序包提供的 formatdb工具格式化序列 数据成数据库Date9blast软件及常用数据库介绍因为构建的fasta格式的数据库文件必须被formatdb格式 化后,才能被

5、BLAST中的blastall、blastpgp、 MegaBLAST等程序使用。 为什么要进行格式化?格式化的步骤:1.打开MS-DOS (开始附件命令提示符)2.进入数据库所在的硬盘3.输入formatdb.exe -i month.nt -p F -o T 再回车formatdb.exe是所用的程序名 -i (input file)参数用于指定需要格式化的数据库 month.nt是一个blast格式的数据库名 -p (type of file)参数用于指定文件类型,T为蛋白 质,F为核酸,默认为T -o (parse options)参数用于指定是否解析序列ID并 创建索引,T为创建,F

6、为不创建,默认为FDate10blast软件及常用数据库介绍原数据库文件formatdb格式化数据库后,创建三个主要的文 件库索引(indices),序列(sequences)和 头(headers)文件。生成的文件的扩展名分别 是:.pin、.psq、.phr(对蛋白质序列)或.nin 、.nsq、.nhr(对核酸序列)。 Date11blast软件及常用数据库介绍Formatdb命令的参数说明表一个单独的blast数据库最大只能为4G,如果格式的数据库大 于4G,在“-v ”参数未设置的情况下,farmatdb程序会自动对数 据库分卷 ,每卷最大为4G。也可以使用“-v ”参数设置卷的大

7、小,比如下面命令将卷的大小设置为2G : formatdb i month.nt p F v 2000000000 Date12blast软件及常用数据库介绍如何在windows操作系统下安装使用本 地BLAST软件?STEP3执行Blast比对 Date13blast软件及常用数据库介绍具体步骤1.将所需比对的序列转化为fasta格式2.执行比对命令3.对比对结果分析Date14blast软件及常用数据库介绍序列的fasta格式是最经常看到的格式之一。Fasta格式开始于一个标识符:“”,然后是一行描述,下面是 一行行的序列。每行最好不要超过80个字母。新建一个名为“text” 的文本文档打

8、开,输入序列,如Text AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGT GTGGATTAAAAAAAGAGTGTCTGATAGCAGC TTCTGAACTGGTTACCTGCCGTGAGTAAATTAAAATTTTA TTGACTTAGGTCACTAAATACTTTAACCAA TATAGGCATAGCGCACAGACAGATAAAAATTACAGAGTA CACAACATCCATGAAACGCATTAGCACCACC ATTACCACCACCATCACCATTACCACAGGTAACGGTGCG GGCTGACGCGTACAGGAAACACAGAAAAAAG

9、 CCCGCACCTGACAGTGCGGGCTTTTTTTTTCGACCAAAG GTAACGAGGTAACAACCATGCGAGTGTTGAA GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCT GCGTGTTGCCGATATTCTGGAAAGCAATGCC AGGCAGGGGCAGGTGGCCACCGTCCTCTCTGCCCCCG CCAAAATCACCAACCACCTGGTGGCGATGATTG AAAAAACCATTAGCGGCCAGGATGCTTTACCCAATATCA GCGATGCCGAACGTATTTTTGCCGAACTTTT 保存在程序 目录下Da

10、te15blast软件及常用数据库介绍具体步骤1.将所需比对的序列转化为fasta格式2.执行比对命令3.对比对结果分析Date16blast软件及常用数据库介绍在DOS窗口中,执行blastall p blastn d month.nt i text.txt o out.txtblastall:通用检索命令-p(program name):为需要使用的程序名blastn:为核酸序列对比搜索程序-d(database name):指定所使用的数据库 的名称-i (input file):待搜索的序列文件-o(output file):指定保存结果的文件Date17blast软件及常用数据库介绍

11、blast常用的一些参数-p: 执行的程序名称 -d: 检索的数据库名称 -i : 要查询的序列文件名 -o :查询结果输出文件名 -m: 比对结果显示格式选项,缺省值为0 ,即pairwise格式。另 外还可以根据不同的需要选择16等不同的格式。 -I :在描述行中显示gi号T/F,缺省值F -v :单行描述(one-line description)的最大数目,缺省值500 -b :显示的比对结果的最大数目,缺省值250 -a:运行BLAST程序所使用的处理器的数目,缺省值1 -T: 产生HTML格式的输出T/F,缺省值F -n: 使用MegaBlast搜索T/F,缺省值F -G: 打开一

12、个gap的罚分(0表示使用缺省设置值),默认0 -E: 扩展一个gap的罚分(0表示使用缺省设置值),默认0 -q: 一个核酸碱基的错配(mismatch)的罚分(只对blastn有效), 缺省值-3 -r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效) ,缺省值1 -M: 所使用的打分矩阵,缺省值BLOSUM62Date18blast软件及常用数据库介绍具体步骤1.将所需比对的序列转化为fasta格式2.执行比对命令3.对比对结果分析Date19blast软件及常用数据库介绍比对结果Date20blast软件及常用数据库介绍Date21blast软件及常用数据库介绍登

13、入NCBI主页点击进入Date22blast软件及常用数据库介绍对核酸进行blast 点击进入Date23blast软件及常用数据库介绍直接输入fasta格 式的未知核酸序 列或者本地上传一个 fasta格式的核酸序列 文件选择一个合适 的数据库进行 比对点击运行Date24blast软件及常用数据库介绍图形结果匹配序列列表Date25blast软件及常用数据库介绍Blast结果的详细比对结果输入的序列在库里比对到的序列Date26blast软件及常用数据库介绍Date27blast软件及常用数据库介绍Date28blast软件及常用数据库介绍GeneBank库包含了所有已知的核酸序列和蛋白质

14、序列,以 及与它们相关的文献著作和生物学注释 ,它是由美国国立生物技 术信息中心(NCBI)建立和维护的。它的数据直接来源于测序工作 者提交的序列 。Genbank每天都会与欧洲分子生物学实验室 (EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这 三个数据库的数据同步。Genbank的数据可以从NCBI的FTP服 务器上免费下载完整的库,或下载积累的新数据。NCBI还提供 广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以 从NCBI的主页上找到这些服务 。 Date29blast软件及常用数据库介绍EMBL核酸序列数据库由欧洲生物信息 学研究所(EBI)维护的核酸序列

15、数据构 成,由于与Genbank和DDBJ的数据合 作交换,它也是一个全面的核酸序列数 据库。 数据库网址是: http:/www.ebi.ac.uk/embl/ Date30blast软件及常用数据库介绍日本DNA数据仓库(DDBJ)也是一个全面的核 酸序列数据库,与Genbank和EMBL核酸库 合作交换数据。可以使用其主页上提供的 SRS工具进行数据检索和序列分析。 DDBJ的网址是: http:/www.ddbj.nig.ac.jp/searches-e.htmlDate31blast软件及常用数据库介绍SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信 息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条 目包含蛋白质序列、引用文献信息、分类学信息、注释等,注 释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级 结构、四级结构、与其它序列的相似性、序列残缺与疾病的关 系、序列变异体和冲突等信息。 该数据库现在以整合进 UniProt数据库中。Swissprot的网址:http:/www.expasy.ch/sprot/Date32blast软件及常用数据库介绍PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源 (PIR)、慕尼黑蛋白质序列信息中心(MIP

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号