山东大学生物信息学课件00概述:什么是生物信息学

上传人:东*** 文档编号:281165331 上传时间:2022-04-23 格式:PPTX 页数:48 大小:6.54MB
返回 下载 相关 举报
山东大学生物信息学课件00概述:什么是生物信息学_第1页
第1页 / 共48页
山东大学生物信息学课件00概述:什么是生物信息学_第2页
第2页 / 共48页
山东大学生物信息学课件00概述:什么是生物信息学_第3页
第3页 / 共48页
山东大学生物信息学课件00概述:什么是生物信息学_第4页
第4页 / 共48页
山东大学生物信息学课件00概述:什么是生物信息学_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《山东大学生物信息学课件00概述:什么是生物信息学》由会员分享,可在线阅读,更多相关《山东大学生物信息学课件00概述:什么是生物信息学(48页珍藏版)》请在金锄头文库上搜索。

1、生物信息学生物信息学 概述:什么是生物信息学概述:什么是生物信息学参考书参考书高等教育十二五规划教材生物信息学、 生物信息学(第二版)和高等教育十三五规划教材生物信息学 ,陈铭,科学出版社生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1866年,奥地利人孟德尔根据实验结果提出了基因是以实物存在的假说;生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1871年,瑞士人Miescher从白细胞细胞核中分离出脱氧核糖核酸(DNA);生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1944年,美国人阿弗莱、麦克李沃和麦克卡三人通过实验证明D

2、NA是生物的遗传物质;生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1944年,美国人Chargaff发现DNA中鸟嘌呤(G)与胞嘧啶(C)数量相等,腺嘌呤(A)与胸腺嘧啶(T)数量相等;生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1953年,英国人Watson和Crick在Nature杂志上发表了DNA的双螺旋结构模型;Watson Crick Wilkins Franklin生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1962年, Watson,Crick和Wilkins因发现了DNA的双螺旋三维结构共同获得了诺贝尔生理

3、学医学奖。生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1954年,Crick提出了中心法则“DNA - RNA - 蛋白质”;生物信息学的产生和发展生物信息学的产生和发展生物信息学的产生和发展生物信息学的产生和发展生物信息学产生的背景: 1966年,美国人Nirenberg和Khorana破译了全部遗传密码字典的64个密码子。生物信息学的产生和发展生物信息学的产生和发展生物信息学的萌生: 1956年,美国田纳西州的盖特林堡召开了“生物学中信息理论研讨会”; 1979年,美国洛斯阿拉莫斯实验室建立了GenBank数据库; 1982年,欧洲分子生物学实验室(EMBL)建立了

4、核酸序列数据库; 1984年,日本建立了核酸序列数据库DDBJ; 90年代初,三大核酸数据库开始资源共享,联合成立了国际核苷酸序列数据库; 1987年,美国学者林华安首创了“bioinformatics”一词,“compbio” - “bioinformatique” - “bio-informatics”;生物信息学的产生和发展生物信息学的产生和发展人类基因组计划: 1990年,国际人类基因组计划启动,预算30亿美元,被誉为生命科学“阿波罗登月计划”,参与国:美、英、日、德、法; 1997年,在耗费了巨额资金和一半预定时间之后,仅完成了3%的工作; 1998年,Craig Venter创立C

5、elera公司; 1999年, Celera公司在无政府资助下,赶超了多国合作小组; 1999年,中国加入多国合作小组,负责测定基因组全部序列的1; 2000年,在美国总统克林顿的协调下, Celera公司与多国合作小组合作,宣布完成了人类基因组草图的90; 2001年,完成了人类基因组草图的99, Celera公司与多国合作小组合作几乎同时分别在Science和Nature上独立发表自己的草图; 2003年,人类基因组序列图绘制成功,彻底完成。 详细情况及推荐视频:中国大学MOOC生命科学与数码革命第一章,第4节。生物信息学的定义生物信息学的定义美国国家基因研究中心:生物信息学是一个代表生物

6、学、数学和计算机科学的综合力量的新兴学科。美国乔治亚理工大学:生物信息学是采用数学、统计学和计算机等方法分析生物学、生物化学和生物物理学数据的一门综合性学科。美国密苏里大学:生物信息学是获知、管理和处理生物信息的科学与技术。美国加州大学洛杉矶分校:生物信息学是对生物信息和生物学系统内在结构的研究,它将大量系统的生物学数据与数学和计算机科学的分析理论及使用工具联系起来。中国军事医学科学院欧阳曙光:生物信息学是研究生物信息的采集、处理、储存、传布、分析和揭示的科学,它通过综合数学、计算机科学与工程学、生物学的工具和技术,揭示大量而复杂的的生物数据所赋有的生物学奥秘。山东大学生院魏天迪:生物信息学是

7、用计算机解决生物问题。生物信息学的发展方向生物信息学的发展方向一、算法、软件和数据库的开发 背景:数学、物理、计算机科学 例如:重复序列蛋白质模板拼接建模算法 EnsemLoc蛋白质亚细胞定位软件 TollML和LRRML数据库二、算法、软件和数据库的应用 背景:生物、医学、化学 例如:Toll样受体及相关蛋白质的结构、功能 与进化学的研究BioinformaticsNucleic acid Protein Others Sequencing Database Transcriptional regulation prediction Gene prediction Molecular evo

8、lution RNA secondary structure prediction Genomics Database Secondary/3D structure prediction Docking Molecular dynamics simulations Molecular design Drug design Proteomics Metabolic network System modeling Bioimaging .生物信息学的研究对象生物信息学的研究对象基因组测序基因组测序测序测序仪仪测序仪:荧光自动测序仪(第一代);高通量测序仪(第二代)测序测序仪仪2012年2月英国牛津

9、纳米孔公司发布公告称,两年内将推出U盘测序仪产品MinION(第三代测序仪),个人基因组的测序将在15分钟内完成。2014年初产品进入试用期,价格为1000美金左右。截止2018年,全球共售出近万台。目前实际测序长度超过150kb。测序测序仪仪纳米孔测序的原理是DNA和RNA测序都能以它们原本的天然形式进行,DNA分子穿过纳米级的小孔,引发电流产生特征性变化来确定序列顺序。纳米孔测序技术是首个且唯一的实时测序技术。一代耗时长价格贵但错误率极低;二代速度快,价格低,但对计算资源要求很高,错误率也较一代高;三代极快极便宜,但错误率最高。 因此,这三代测序技术之间并不是互相淘汰互相取代的关系,而是互

10、补共赢的局面。三代三代测序测序技术之间的关系技术之间的关系生物数据库生物数据库1. 核酸数据库国际核苷酸序列数据库2. 蛋白质数据库=3. 蛋白质结构数据库4. 其他专项生物数据库基因预测基因预测1.外部预测法2.从头预测法3.比较基因组法基因预测基因预测1.外部预测法外部预测法2.从头预测法3.比较基因组法基于其他大量已知基因情况的核酸序列(基因组),对目标核酸序列进行相似性搜索。基因预测基因预测1.外部预测法2.从头预测法从头预测法3.比较基因组法不与其他核酸序列进行比较,根据不同物种基因本身的序列特征进行基因预测。GENSCAN基因预测基因预测1.外部预测法2.从头预测法从头预测法3.比

11、较基因组法不与其他核酸序列进行比较,根据不同物种基因本身的序列特征进行基因预测。内含子5GTAG3基因预测基因预测1.外部预测法2.从头预测法3.比较基因组法比较基因组法根据自然选择的原理,基因区域的变异率应该远低于其他区域。很多物种的基因组已被完全测序,这样,比较相关物种基因组,保守区也就是潜在的基因区。基因表达调控分析基因表达调控分析四个水平上的基因表达调控:转录水平转录水平、转录后水平、翻译水平、翻译后水平。山东大学数学学院李国君教授:BOBRO A BOTTLENECK BROCKEN TOOL FOR MOTIF FINDINGNucleic Acids Research (IF 7

12、.5)RNA二级结构预测二级结构预测长链非编码RNA或tRNA可通过自身碱基互补形成二级结构,如三叶草结构,来行使调解蛋白质功能的功能。蛋白质结构蛋白质结构蛋白质四个水平上的结构:蛋白质二级结构预测蛋白质二级结构预测已知一个蛋白质的氨基酸序列,预测其二级结构。常用软件:PSIPRED, APSSP2, NNPREDICT, PREDICTPROTEIN蛋白质三维结构蛋白质三维结构all beta alpha+beta all alpha 蛋白质三维结构预测蛋白质三维结构预测已知一个蛋白质的氨基酸序列,预测其三维结构。三类方法:1. 同源建模法;2. 穿线法;3. 从头预测法;4.机器学习法。M

13、EAKIVKVLDSSRCEDGFGKKRKRAASYAAYVTGVSCAKLQNVPPPNGQCQIPDKRRRLEGENKLSAYENRSGKALVRYYTYFKKTGIAKRVMMYENGEWNDLPEHVICAIQNELEEKSAAIEFKLCGHSFILDFLHMQRLDMETGAKTPLAWIDNAGKCFFPEIYESDERTNYCHHKCVEDPKQNAPHDIKLRLEIDVNGGETPRLNLEECSDESGDNMMDDVPLAQRSSNEHYDEATEDSCSRKLEAAVSKWDETDAIVVSGAKLTGSEVLDKDAVKKMFAVGTASLGHVPVLDVGRFS

14、SEIAEARLALFQKQVEITKKHRGDANVRYAWLPAKREVLSAVMMQGLGVGGAFIRKSIYGVGIHLTAADCPYFSARYCDVDENGVRYMVLCRVIMGNMELLRGDKAQFFSGGEEYDNGVDDIESPKNYIVWNINMNTHIFPEFVVRFKLSNLPNAEGNLIAKRDNSGVTLEGPKDLPPQLESNQGARGSGSANSVGSSTTRPKSPWMPFPTLFAAISHKVAENDMLLINADYQQLRDKKMTRAEFVRKLRVIVGDDLLRSTITTLQNQPKSKEIPGSIRDHEEGAGGL蛋白质三维结构预测蛋白质

15、三维结构预测同源建模法:相似的氨基酸序列对应着相似的蛋白质结构。蛋白质三维结构预测蛋白质三维结构预测穿线法:不相似的氨基酸序列也可能对应着相似的蛋白质结构。蛋白质三维结构预测蛋白质三维结构预测穿线法:不相似的氨基酸序列也可能对应着相似的蛋白质结构。已知结构的蛋白质18万,不同的结构拓扑 1313。蛋白质三维结构预测蛋白质三维结构预测从头预测法:1973年 Anfinsen 科学:蛋白质的三维结构决定于自身的基酸序列,并且处于最低自由能状态。由于运算量和准确度的问题,只适合几十个氨基酸长的蛋白质。蛋白质三维结构预测蛋白质三维结构预测机器学习法(人工智能):基于深度神经网络,在数千已知的蛋白质上训

16、练了一个神经网络,基通过因序列来预测蛋白质的3D结构。DEEPMIND公司蛋白质对接蛋白质对接对接要考虑的三个因素:1. 几何形状互补;2. 分子表面电荷互补;3. 疏水作用。蛋白质蛋白质对接蛋白质对接蛋白质对接对接要考虑的三个因素:1. 几何形状互补;2. 分子表面电荷互补;3. 疏水作用。小分子化合物蛋白质对接分子动力学模拟分子动力学模拟1 ns 20 cpu5 hVirtual screeningVirtual screeningLibrary of Library of chemical chemical compoundscompounds虚拟分子筛选计算机辅助药物设计计算机辅助药物设计分子进化分子进化DNA在进化过程中积累突变,导致了不同株系后代DNA,RNA和蛋白质序列的分歧。这个原则可以被用来构建系统发生树。由于内部突变率和选择性限制的差异,不同的大分子序列进化速率不同,使得对密切相关和远距离相关的生物体都可以进行系统发生分析。代谢网络代谢网络代谢网络是决定细胞生理、生化特性的一整套代谢过程和物理过程。通过对代谢网络的研究(构建网络、拓扑分析、代谢流分析)能更好地了解生

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 生物学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号