信息生物学资料教程

上传人:yulij****0329 文档编号:141723421 上传时间:2020-08-11 格式:PPT 页数:45 大小:1.68MB
返回 下载 相关 举报
信息生物学资料教程_第1页
第1页 / 共45页
信息生物学资料教程_第2页
第2页 / 共45页
信息生物学资料教程_第3页
第3页 / 共45页
信息生物学资料教程_第4页
第4页 / 共45页
信息生物学资料教程_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《信息生物学资料教程》由会员分享,可在线阅读,更多相关《信息生物学资料教程(45页珍藏版)》请在金锄头文库上搜索。

1、现代生物学实验技术生物信息与数据处理,毛理凯,本课件在安装微软雅黑字体后有最好效果 【详细说明见jiaoan.htm】,2,机房注意事项,不得做课堂以外的事情,一经发现,立刻驱逐并记录通报。 严禁随意设置、升级系统。 将自己产生的垃圾带走;爱护机房设备。 有问题通报老师。 部分鼠标不好使,下面垫张白纸就可以了。 注意脚不要踢到下面的线。 仔细阅读教案,提问前先在本教案上找答案。,3,电脑操作相关事项,登录 开机自动进入Ubuntu系统(Linux的一个版本)后,输入用户名owner和密码buxudong!登录。 复制教案(可选) 点击菜单栏上的“Places/Home Folder”打开文件查

2、看器(File Browser; 相当于Windows的资源管理器),如果没有看到jiaoan.ppt(或jiaoan.htm)文件,按照下列步骤复制。,5,本课目录,生物数据查询 分子进化与系统分析,6,一、生物数据查询,7,网上查资料,Google (“谷歌”) ,8,Google查询结果,9,查中文生物文献,10,查英文生物文献,PubMed (),可编程,11,关键词的选择,不是特殊情况,尽量使用名词原形,不使用复数、所有格等 尽量使用专业用语,不使用the, of, and, research等常用词作为关键词 为了减少遗漏,使用尽可能少而精的关键词,12,PubMed查询结果(1)

3、 所有文章,13,PubMed查询结果(2) 综述文章,保存搜索结果,查看该文摘要,14,增加搜索选项,15,精确使用PubMed查找(高级搜索),标签(tag),字段(field),关键词(keyword),操作符(operator),检索条件(search terms),16,查找帮助(1),17,查找帮助(2),18,NCBI,美国国家生物技术信息中心(National Center for Biotechnology Information) 前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(National Library of Me

4、dicine/NLM) 管理着许多著名数据库,如GenBank、Medline、dbSNP、COG、OMIM等 提供Entrez、BLAST等服务 http:/www.ncbi.nlm.nih.gov,19,国际核苷酸序列数据库联盟,International Nucleotide Sequence Database Collaboration (INSDC)包括 GenBank 美 http:/www.ncbi.nlm.nih.gov/Genbank EMBL 欧 http:/www.ebi.ac.uk/embl/ DDBJ 日 http:/www.ddbj.nig.ac.jp/ 每天这三个

5、数据库作数据同步操作 在任何一个数据库操作(查找、投递数据等)是等效的,20,GenBank主页,可编程,21,GenBank结构,GenBank包括三个子数据库 CoreNucleotide dbEST dbGSS 其中CoreNucleotide还分为更小的BLAST数据库 nr htgs wgs env_nt,22,GenBank查询(1),已知收录号(accession number)的情况,选数据库,输入收录号,查询结果摘要,点击查看详细结果,不知收录号时,如要搜索人体中的解旋酶,可以在下拉框中选择“Nucleotide”后,输入“helicase AND humanorgn”(不要

6、输入引号),23,作业,【作业一般性的要求参见附录一,本作业具体的要求见下。】 题目 用PubMed搜索你感兴趣的课题相关的 序列 或 综述文献(review)。 要求 将搜到的文献/序列的基本信息(文献包括标题、杂志名、卷、期、页码、时间、作者,注意不要摘要;序列只要简单注释)上交。 文献总篇数/序列总条数限制在20以内。如果超过20不列出超出的部分,只列出实际的总数。 在步骤中说明你选择 关键词 和 限制条件 的理由。,24,二、分子进化与系统分析,25,FASTA序列格式,也叫Pearson格式 简单 使用最多 例子(单序列),Name of the sequence ctgcgagNc

7、gcgcgatgatagMMM-NNNnnnnatgancgcggcgagcatgtagcatgcta gctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc,“-”表示间隔,26,多序列FASTA,sequence1, E. coli ctgcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgcta gctgtcgcgagcactUgaURRRrrrt

8、rrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgcc sequence2, B. subtilis ctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgcta gctgtcgcgagcactUctURRRrrrcrrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgc

9、c sequence3, B. natto ctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgcta gctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc,27,FASTA序列格式中的核苷酸表示法,28,FASTA序列格式中的氨基酸表示法,29,如何用PubMed找蛋白(BLAST第一步),选Protein,输入关键词,选一个蛋白,30,bla

10、stp (1) BLAST主页,点此进入blastp起始页,31,blastp (2) blastp起始页,在这里输入要搜索的蛋白质的收录号(accession number)或序列,点此开始搜索,如果要限制搜索的物种(如水稻),可在Organism处输入Oryza sativa(水稻的拉丁名),32,点此看结果,blastp (3) 提交后页面,33,blastp (4) 结果页(1.基本信息),34,blastp (5) 结果页(2.比对图),35,blastp (6) 结果页(3.高分序列),36,blastp (7) 结果页(4.高分序列详细结果),consensus,37,比对(ME

11、GA),38,比对,39,比对,40,建树(MEGA),关闭比对窗口后自动弹出对话框,41,建树,42,作业,【作业一般性的要求参见附录一,本作业具体的要求见下。】 搜索你所感兴趣的蛋白及其同源物的序列(序列不超过20条),分析这些序列之间的进化关系,建立系统树。将树输出为(File/Export;相当于另存为)Newick格式,将输出的nwk文件的内容(例子见下)复制在作业正文内(不要贴图)。并对结果进行解释。 【Newick树例子】 (gi|42673|emb|CAA23618.1|_recA_gene_pr.,gi|86449963|gb|ABC96175.1|_RecA_prote.)

12、0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche.,gi|86449965|gb|ABC96176.1|_RecA_prote.)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote.);,43,附录一 作业一般性的要求,请严格按照要求(包括一般性和具体要求)做作业,这些要求将作为打分的重要依据。 任选以上作业之一上交。 作业要包括详细完成步骤,其中的所有引用或用到的网页/文献请注明网址或出处。 作业请在第8周(4月19日)之前在上交。,44,附录二 常见问题集,什么是文件的扩展名?怎样才能看到扩展名? 扩展名是文件名末尾点

13、号(.)后面的部分,如文件实验报告.doc的扩展名是doc。缺省情况下,Windows XP会(Linux一般不会)隐藏已知的文件扩展名。要想看到扩展名,打开资源管理器,点击菜单项工具/文件夹选项,选择查看标签,去掉隐藏已知文件类型的扩展名复选框即可。 什么是纯文本文件?什么是二进制文件? 纯文本文件一般也叫文本文件。一个简单的判断文本文件的方法:用记事本(Windows下)或gedit(Linux下)打开这个文件,能够阅读的为纯文本文件,不能阅读的为二进制文件。另一个方法,由扩展名判断。常见的纯文本文件有:文本文件(txt)、网页文件(htm, html)等;常见的二进制文件有:Word文件(doc)、PowerPoint文件(ppt)、Excel文件(xls)、图形文件(jpg, gif, png, .)、音频文件(wav, mp3, .)、视频文件(avi, wmv, rm, rmvb, mov, .)、可执行文件(exe)等。 Linux下如何编辑纯文本文件? 在终端窗口输入命令gedit &(不要引号),再回车即可。,45,完,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号