生物信息学精L1ppt课件

上传人:资****亨 文档编号:145059291 上传时间:2020-09-16 格式:PPT 页数:85 大小:4.95MB
返回 下载 相关 举报
生物信息学精L1ppt课件_第1页
第1页 / 共85页
生物信息学精L1ppt课件_第2页
第2页 / 共85页
生物信息学精L1ppt课件_第3页
第3页 / 共85页
生物信息学精L1ppt课件_第4页
第4页 / 共85页
生物信息学精L1ppt课件_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《生物信息学精L1ppt课件》由会员分享,可在线阅读,更多相关《生物信息学精L1ppt课件(85页珍藏版)》请在金锄头文库上搜索。

1、.,1,生物信息学Bioinformatics,凌毅 Bioinfo_,.,2,课程简介,课程目标 课程形式 参考教材与文献 教师联系方式 成绩构成 课程网站 实验室要求,.,3,课程目标,掌握生物信息学基本知识与概念 了解生物信息学网上资源 针对核酸及蛋白质的分析 介绍全基因组表达的分析方法 生物学研究中具体问题的解决,.,4,课程形式,讲授概念与知识点(Textbooks) 自学与讨论(Group learning) 理解(Literature references) 掌握与巩固(Computer exercises),双语教学!,.,5,主要参考教材,生物信息学(中译本),王明怡等译校,

2、科学出版社(第二版) Q811.4/14, Q811.4/WDR 各章节基本概念 *生物信息学与功能基因组学,孙之荣主译,化学工业出版社,2006. Q811.4/19 序列比对, 系统发育 (英文电子版) Bioinformatics for DUMMIES, Jean-Michel Claverie, John Wiley, 2007. 院图书室 实验练习 (电子版) Bioinformatics: A practical guide to the genes and proteins, Baxevanis 38 Suppl:W64-70. Epub 2010 Apr 30. Arabid

3、opsis Hormone Database: a comprehensive genetic and phenotypic information database for plant hormone research in Arabidopsis. Peng ZY, Zhou X, Li L, Yu X, Li H, Jiang Z, Cao G, Bai M, Wang X, Jiang C, Lu H, Hou X, Qu L, Wang Z, Zuo J, Fu X, Su Z, Li S, Guo H. Nucleic Acids Res. 2009 Jan;37(Database

4、 issue):D975-82. Epub 2008 Nov 10. Genes and (Common) Pathways Underlying Drug Addiction. Li CY, Mao X, Wei L. Plos Computational Biology, 2008, Jan 4;4(1):e2,.,24,Limitation,Avoid over-reliance (过分依赖) or an over-expectation (期望值过高) of bioinformatics output! Bioinformatics predictions are not formal

5、 proofs of any concepts. The quality of bioinformatics predictions depends on the quality of data and the sophistication of the algorithms being used.,.,25,本讲内容,1. 什么是生物信息学 - What is Bioinformatics - 应用领域 Application - 局限性 Limitation 2. 生物学资源 (数据来源) - Types of databases - Introduction of major biolo

6、gical databases - How to find suitable biological resource for research - Major bioinformatics websites,3. 序列数据库 (数据内容) - Nucleotides databases - Protein databases - Other sequence databases - 序列的格式 - FASTA - EMBL / GenBank flatfile - Importance of accuracy of nucleotide sequence entry,.,26,Database

7、,是一类用于存储和管理数据的计算机文档,其存储形式有利于数据信息的检索与调用。 相关术语 Entry, 即数据库的一条记录; Field(字段),指数据中某一类特性,如姓名、年龄 Value(值),指具体一条记录中某个字段中的具体内容; Making a query, 指用户在数据库中用属于特定字段的特定值在整个数据库中提取信息的过程。,概念,.,27,Types of databases,Flat file (平面文件) a long text file that contains many entries separated by a special delimiter (分隔符). A

8、number of fields separated by tabs or commas (also act as delimiter) in each entry Relational Databases (关系型数据库) Use a set of tables to organize data Columns (fields) and rows (values) in different tables could be cross-referenced according to some specific fields and rows. Programming language: str

9、uctured query language (SQL) Object-Oriented Databases (对象型数据库) Better than RD to describe complex hierarchical relationships between data items. Programming language: C+,.,28,Biological Database,可使用关系型、对象型等类型的数据库甚至以平面文件的形式进行建设。 除了能够满足数据的存储及快速的检索等一般数据库的目的之外,生物学数据库的建设与使用还有更高层次的需求:知识发现 (knowledge disc

10、overy). 知识发现是指能够找出最初并不知道的各个信息片段之间的联系,即从数据集中识别出有效的、新颖的、潜在有用的,基本可理解模式的过程。举例:从原始的序列数据中鉴定保守的序列基序。,.,29,Biological Database,Based on content, biological databases can be roughly divided into Primary Databases(一级数据库) 存储来源于具体实验的序列数据/结构数据 Secondary Databases(二级数据库) 数据记录中加入了手工/计算加工的内容,比如功能的注释。 Specialized da

11、tabases(专用数据库) 满足特定研究的需要,DNA,RNA,cDNA ESTs UniGene,phenotype,genomic DNA databases,protein sequence databases,protein,Other genomic information database, such as markers,Expression Profile databases in different conditions,PIP information database, 2D images,.,31,Major Biological Databases,Primary D

12、atabases GenBank EMBL DDBJ PDB Secondary Databases UniProtKB ( or Swiss-Prot / TrEMBL) InterPro pFAM Specialized Databases FlyBase TAIR OMIM ,自己动手: 这些数据库的内容都是什么?,.,32,Major Biological Databases,Primary Databases GenBank 核酸序列数据库 EMBL 核酸序列数据库 DDBJ 核酸序列数据库 PDB 蛋白质三维结构数据库 Secondary Databases UniProtKB(S

13、wiss-Prot / TrEMBL) 蛋白质序列数据库 InterPro 蛋白质家族,结构域,重复序列及位点数据库 pFAM 蛋白质家族数据库 Specialized Databases FlyBase 果蝇遗传与分子生物学数据库 TAIR 拟南芥信息资源数据库 OMIM 人类遗传疾病数据库 ,.,33,Question,Since there are plenty of databases, how could we know which is suitable for our research?,.,34,练习与讨论,根据要求查找相关的数据库: 遗传病(genetic diesease)

14、数据库; 蛋白质互作(protein protein interaction)数据库; 信号途径(signalling pathway) 数据库 讨论查找上述数据库所使用的方法,步骤。,.,35,Solution,办法1:通过搜索引擎利用适当的关键字进行查找;-缺点: 数据库的可用性、可靠性没有保证 办法2:查找各生物信息学教材、教参书及其附录 办法3:通过阅读学术期刊Nucleic Acid Research 每年年初的数据库专刊及年中的网络服务器专刊 Database / Web Server issue 办法4:在熟悉的生物信息专业站点中查找,.,36,NAR,Nucleic Acid

15、Research 期刊网址:http:/nar.oxfordjournals.org/,.,37,Database issue,.,38,公共数据库分类列表http:/www.oxfordjournals.org/nar/database/c/,NAR将收集的数据库分成14类: 核酸序列数据库 RNA序列数据库 蛋白质序列数据库 结构数据库 基因组数据库(非脊椎动物) 代谢途径及信号途径 人类及其它脊椎动物基因组 人类基因与疾病 微阵列数据及其它基因表达数据库 蛋白质组学资源 其它分子生物学数据库 细胞器数据库 植物数据库 免疫数据库,.,39,NAR分类的细化,.,40,NAR Web Se

16、ver Categories list,.,41,Mainly Bioinformatics sites,任务包括 -提供生物信息数据库资源和生物计算服务 -提供用户支持和培训 -进行生物信息的研究和开发,.,42,练习,前后桌合作,利用Google搜索引擎分别搜寻下列站点,记录站点的全称与网址 NCBI EBI ExPASy CBI 进入相应站点,利用SiteMap, Site index, databases等栏目查找此站点内有无p32描述过的数据库,.,43,Mainly Bioinformatics Websites,美国国家生物技术信息中心 (NCBI) - National Centre for Biotechnology Information contains GenBank, OMIM 欧洲生物信息研究所(EBI) - European Bioinformatics Institu

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号