生物信息学的概念及其发展

上传人:ap****ve 文档编号:118740190 上传时间:2019-12-24 格式:PPT 页数:54 大小:5.12MB
返回 下载 相关 举报
生物信息学的概念及其发展_第1页
第1页 / 共54页
生物信息学的概念及其发展_第2页
第2页 / 共54页
生物信息学的概念及其发展_第3页
第3页 / 共54页
生物信息学的概念及其发展_第4页
第4页 / 共54页
生物信息学的概念及其发展_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《生物信息学的概念及其发展》由会员分享,可在线阅读,更多相关《生物信息学的概念及其发展(54页珍藏版)》请在金锄头文库上搜索。

1、任课教师:李继刚 办 公 室:逸夫楼1107 陈铭主编生物信息学,科学出版社, 2012 Lesk, A.M., Introduction to Bioinformatics, Oxford University Press, 2005 其他资源(包括网络资源) 考核方式:作业+期末测验 要求:课堂听讲,课下实践。 教学辅助:互联网资源 二战后,生物学及计算机技术发展迅猛,将信息 技术(IT)应用于生物学研究就成为必然; 特别是随着组学时代的到来,海量的生物学数据 必须通过生物信息学的手段进行收集、分析和整 理,生物信息学技术就成了生物学研究的必需; 一、生物学信息学的发展历史一、生物学信息学

2、的发展历史 (1)萌芽期(60-70年代) 以Dayhoff的替换矩阵和Needleman-Wunsch算 法为代表,这是生物信息学的一个最基本的 内容和思路:序列比较。 (2)形成期(80年代) 以分子数据库和BLAST等相似性搜索程序为 代表。1982年三大分子数据库的国际合作 使数据共享成为可能,同时为了有效管理 与日俱增的数据,以BLAST、FASTA等为代 表工具软件和相应的新算法大量被提出, 极大地改善了人类管理和利用分子数据的 能力。在这一阶段,生物信息学作为一个 新兴学科已经形成,并确立了自身学科的 特征和地位; http:/www.ddbj.nig.ac.jp/ http:/

3、www.embl.org/ http:/www.ncbi.nlm.nih.gov/ (3)高速发展期(90年代-至今) 以基因组测序与分析为代表。基因组计划 ,特别是人类基因组计划的实施,分子数 据以亿计;基因组水平上的分析使生物信 息学的优势得以充分表现,基因组信息学 成为生物信息学中发展最快的学科前沿。 生物学、信息技术以及生物信息学相关大事记 二、生物信息学定义 定义一:生物信息学是一门收集、分析遗传数据 以及分发给研究机构的新学科(Bioinformatics is a new subject of genetic data collection, analysis and disse

4、mination to the research community)。(林华安,Dr. Hwa A. Lim,1987) 定义二:生物信息学是在大分子方面的概念型的 生物学,并且使用了信息学的技术,这包括了从 应用数学、计算机科学以及统计学等学科衍生而 来各种方法,并以此在大尺度上来理解和组织与 生物大分子相关的信息。 (Luscombe,2001) 生物信息学定义(2) Bioinformatics is the field of science in which biology, computer science, and information technology merge int

5、o a single discipline. The ultimate goal of the field is to enable the discovery of new biological insights as well as to create a global perspective from which unifying principles in biology can be discerned. Biology in the 21st century is being transformed from a purely lab-based science to an inf

6、ormation science as well. 广义生物信息学观点 Biology may be viewed as the study of transmission of information: from mother cell to daughter cell, from one cell or tissue type to another, from one generation to the next, and from one species to another. This informational viewpoint is termed bioinformatics 生

7、物学研究可以被看成是研究信息的传递:从DNA经转录翻译 到蛋白质,从细胞质中到细胞核内,从母细胞到子细胞,从一 个细胞或一个组织到另一个细胞或另一个组织,从一代到下一 代,从一个物种到另一个物种的进化演变。这种信息论的观点 即可称为生物信息学(Eisenberg et al., 2006)。 3、生物信息学的发展历程 1952年,Sanger根据胰岛素蛋白质的测序结果,推断 蛋白质是排列完美的分子。-最早的信息论观点。 1955年,Sanger与合作者分别对牛、猪和羊的胰岛素 蛋白质进行了测序并做了序列上的比较。-最早的序列比 对。 1962年,鲍林提出分子进化的理论,推测在人中可能存 在50

8、,000100,000个不同的基因/蛋白质。-分子进化理 论的奠定。 1965年,Margaret Dayhoff构建蛋白质序列图谱 1970年,Needleman-Wunsch算法:全局优化比对。 1981年,Smith-Waterman算法开发:局部优化比对。 1990年,快速序列相似性搜索工具BLAST的开发 生物信息学发展过程中的里程碑 80年代:DNA序列数据库 1. 1974年,George I.Bell等人收集DNA序 列,构建GenBank数据库。19821992开 发第一个版本。 2. 1980年,EMBL数据库成立。 3. 1984年,日本DDBJ数据库成立。 4. 核酸序

9、列数据的去冗余:Refseq数据库 ,对于相同的序列只列一条目录。 核酸数据库数据的增长 DNA 核酸序列 蛋白质 氨基酸序列 蛋白质 结构 蛋白质 功能 最基本的 生物信息 维持生命活 动的机器 第一部 遗传密码 第二部 遗传密码? 生命体系千姿 百态的变化 获取序列及检索公共数据库 1. Entrez的开发,D.Lipman等人。 2. 提供关键字的搜索的方法。 3. “硬搜索”:包含关键字的,完全匹配的结果。 4. “软搜索”:与查询内容相关的信息。 5. 查询内容:基因/蛋白质的名称、标识符, 文献、蛋白质结构,等等。 http:/www.ncbi.nlm.nih.gov/sites/

10、gquery 序列比对工具的开发 1. 1970年,Gibbs AJ 和 McIntyre GA,点阵法进 行氨基酸和核酸的序列比较:当相同的字母在两条 序列中同时出现时,在交叉处置点。 2. 1970年,Needleman-Wunsch,全局优化的序列 比对算法:允许匹配、错配和缺失。动态规划的算 法:任务可分割,分成更小的子问题进行解决。 3. 1981年,Smith-Waterman,局部优化的序列比 对算法。 4. FASTA Unix: Workstation and servers; MacOS: Apple Macintosh You are probably accustome

11、d to working with personal computers; you may be familiar with windows interfaces, word processors, and even some data-analysis packages. However, if you want to use computers as a serious component in your research, you need to work on computer systems that run under Unix or some Unix-like operatin

12、g systems. 稳定性好: Over 25 years in industry and academia. 开放性好:Supporting possible tasks in future. Internet上的操作系统:The software that powers the Web was invented in Unix, and many if not most web servers runs on Unix servers. 科学软件的载体:Many good-quality, interesting and important scientific software are

13、 written for Unix. 共享的乐园:Many programs can be downloaded and installed on Unix systems for free. 几乎所有的大型数据库都运行于Unix之上(或至少有基 于Unix的版本),如Genbank和EMBL。 Linux is a free, open source version of Unix. Linux can turn an ordinary PC into a powerful workstation. Command-line: 需要硬件资源低,更高效。 X-windows: 需要硬件资源更高

14、,更直观。 By configuring your system with Linux and other open source software, you can have access to a lot of powerful computational biology and bioinformatics tools at a low cost. DOSUNIX MS Windows linuxMacOs ReadHatUbuntuCentOs Fedora My Compute r 多用户 开源性 字符操作 我的电脑 本地磁盘(C:)本地磁盘(D:)本地磁盘(E:) Window s

15、 Program files Documents and settings musicsmovies My Document s All users Administrator My Work training use of linux.pptx Better man.mp3 baby.mp3 命令作用命令作用 cp拷贝文件或目录(文件夹)du显示磁盘空间的使用情况 mv移动文件或目录more/less/ca t 查看文件内容 rm删除文件或目录head/tail 查看文件头/尾几行 mkdir新建文件或目录top查看当前运行程序 rmdir删除空目录kill终止某些进程 cd进入目录find

16、寻找特定文件 pwd显示当前目录的绝对路径passwd为用户设置口令(密码) ls列出目录的内容su切换用户 sort对文件中的各行排序write写信息给某位系统用户 tar为文件或目录创建归档(压缩)shutdown关机 grep寻找文件中的关键词date显示当前日期 chmod修改文件或目录的权限clear清除当前屏幕上的信息 Perl 最初只是 Unix 系统管理员的一个工具,在工 作日里被用在无数的小任务中。从那以后,它逐步发 展成为一种全功能的程序设计语言,特别是在各种计 算平台上,它被用作 Web 编程、数据库处理、XML 处理以及系统; Perl是一门自由且功能强大的编程语言。自 1987年 初次登台亮相以来,它的用户数一直急剧膨胀。从最 初被当作一种在跨平台环境中书写可移植工具的高级 语言开始,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号