生物信息学绪论

上传人:pu****.1 文档编号:570184238 上传时间:2024-08-02 格式:PPT 页数:54 大小:6.76MB
返回 下载 相关 举报
生物信息学绪论_第1页
第1页 / 共54页
生物信息学绪论_第2页
第2页 / 共54页
生物信息学绪论_第3页
第3页 / 共54页
生物信息学绪论_第4页
第4页 / 共54页
生物信息学绪论_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《生物信息学绪论》由会员分享,可在线阅读,更多相关《生物信息学绪论(54页珍藏版)》请在金锄头文库上搜索。

1、生物信息学概论生物信息学说文解字:生物 + 信息 + 学学 (bioinformatics) biology + information + theory广义广义 应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学生命科学中的信息科学信息科学。狭义狭义 应用信息科学信息科学的理论、方法和技术,管理、分析和利用生物分子生物分子数据。 A marriage of BiologyInformationtechnology生物信息学研究分类算法开发算法开发生物学研究应用生

2、物学研究应用BlastBlastu收集、整理、储存、加工、发收集、整理、储存、加工、发布和分析生物学数据布和分析生物学数据3、生物信息学的研究内容、生物信息学的研究内容u发展新的数理和信息科学的技发展新的数理和信息科学的技术和方法用于管理和分析生物术和方法用于管理和分析生物数据数据(生物工作者)(生物工作者)(数理和信息(数理和信息科学工作者)科学工作者)2、生物信息学基本方法和技术、生物信息学基本方法和技术u建立生物数据库建立生物数据库v各种公共数据库各种公共数据库v本地化数据库本地化数据库u数据库检索数据库检索v各种数据检索工具的开发和使用各种数据检索工具的开发和使用Entrez检索体系检

3、索体系BLAST检索体系检索体系u生物大分子序列分析生物大分子序列分析vHomologous sequence analysis(同源序列分析)同源序列分析)vMultiple sequence alignment(多序列对位(对多序列对位(对齐)排列)齐)排列)vEvolution analysis(进化分析)进化分析)Phylogenetic prediction(系统发育预测)系统发育预测)进化方式分析进化方式分析进化位点分析进化位点分析v基因组分析基因组分析序列拼接序列拼接序列注释序列注释v基因功能、结构分析基因功能、结构分析v蛋白质功能、结构分析蛋白质功能、结构分析v蛋白质三维结构预

4、测蛋白质三维结构预测v蛋白质修饰蛋白质修饰vElectronic PCRu统计模型统计模型vHidden Markov model(HMM,隐马尔可夫模型)隐马尔可夫模型) 基因识别和药物设计基因识别和药物设计vMaximum likelihood model(最大似然模型)最大似然模型) 序列进化分析序列进化分析u数学算法数学算法v自动序列拼接自动序列拼接v外显子预测外显子预测v同源序列比较同源序列比较人类基因组:人类基因组: 3.2109 bp 已测序的重要模式生物:已测序的重要模式生物:H.inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenor

5、habditis elegans秀丽线虫秀丽线虫大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥基因组演化与物种演化基因组演化与物种演化 (生命之树)怎怎样样利利用用数数据据库库?寻找基因序列信息寻找基因序列信息序列比较分析序列比较分析生物信息学的发展过程大致经历了3个阶段:前基因组时代-生物数据库的建立、检索工具的开发、DNA和蛋白质序列分析、全局和局部的序列对位排列;基因组时代-基因寻找和识别、网络数据库系统的建立、交互界面的开发;后基因组时代-大规模基因组分析、蛋

6、白质组分析。生物信息学的研究内容生物信息学的研究内容1、 生物分子数据的收集与管理生物分子数据的收集与管理2、 数据库搜索及序列比较数据库搜索及序列比较 3、 基因组序列分析基因组序列分析 4、基因表达数据的分析与处理基因表达数据的分析与处理 5、蛋白质结构与功能预测蛋白质结构与功能预测6、基因基因-蛋白相互作用网络蛋白相互作用网络 7、整个系统调控网络、整个系统调控网络基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR生物分子数据的收集与管理数据库搜索及序列比较数据库搜索及序列比较 搜

7、索同源序列在一定程度上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列寻找相似序列 序列比较序列比较的一个基本操作就是的一个基本操作就是比对比对(Alignment),即将两个序列的各个字符),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种列共有的排列顺序,这是序列相似程度的一种定性描述定性描述多重序列比对多重序列比对研究的是多个序列的共性。序列研究的是多个序列的共性。序列的多重比对可用来搜索基因组序

8、列的功能区域,的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。也可用于研究一组蛋白质之间的进化关系。 基因组序列分析基因组序列分析 遗传语言分析遗传语言分析天书天书 基因组结构分析基因组结构分析基因识别基因识别基因功能注释基因功能注释基因调控信息分析基因调控信息分析基因组比较基因组比较基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据分析基因表达数据分析是目前生物信息学研究的热是目前生物信息学研究的热 点和重点点和重点 目前对基因表达数据的处理主要是进行目前对基因表达数据的处理主要是进行聚类分聚类分 析析,将表达模式相似的基因聚为一类,在此基,将表达模

9、式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能础上寻找相关基因,分析基因的功能 所用方法所用方法主要有:相关分析方法、模式识别技主要有:相关分析方法、模式识别技术中的层次式聚类方法、人工智能中的自组织术中的层次式聚类方法、人工智能中的自组织映射神经网络、主元分析方法映射神经网络、主元分析方法 等等表达数据表达数据缺点缺点:仅反映:仅反映mRNA丰度,噪声,丰度,噪声,基因芯片基因微阵列或DNA芯片(gene microarray 或DNA chips)的原理是将几万个寡核苷酸或DNA作为探针,密集排列于硅片等固相支持物上,将研究样品标记后与微点阵杂交并进行检测。根据杂交信号强弱

10、及探针位置和序列,可以确定靶DNA的表达情况以及突变和多态性存在与否。DNA 微阵列(基因芯片)微阵列(基因芯片)基因表达的层次聚类分析新陈代谢:新陈代谢:116,环境信息处理:环境信息处理:24,细胞信息处理:细胞信息处理:20,遗传信息处理:遗传信息处理:10;碳水化合物代谢:碳水化合物代谢:36,信号传导:信号传导:17,二次新陈代谢生物合成:二次新陈代谢生物合成:16,能量代谢:能量代谢: 11,细胞生长与死亡基因:细胞生长与死亡基因:11,多糖合成与代谢;多糖合成与代谢; 10,生物异源物质的降解:生物异源物质的降解:10氨基酸代谢:氨基酸代谢: 9,辅因子与维生素的代谢:辅因子与维

11、生素的代谢:9。表达基因的功能分类表达基因的功能分类协同表达基因的聚类分析 蛋白质结构预测蛋白质结构预测 蛋白质的生物蛋白质的生物功能功能由蛋白质的由蛋白质的结构结构所决定所决定 ,蛋,蛋白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径蛋白质结构预测分为蛋白质结构预测分为:二级结构预测二级结构预测空间结构预测空间结构预测 蛋白质折叠蛋白质折叠二级结构预测二级结构预测在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有:在二级结构预测方面主要方法有:立体化学方法立体化学方法图论方法图论方法统

12、计方法统计方法最邻近决策方法最邻近决策方法基于规则的专家系统方法基于规则的专家系统方法分子动力学方法分子动力学方法人工神经网络方法人工神经网络方法 预测准确率超过预测准确率超过70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统空间结构预测空间结构预测在空间结构预测方面,比较成功的理论在空间结构预测方面,比较成功的理论方法是方法是同源模型法同源模型法 该方法的依据是:相似序列的蛋白质倾该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构向于折叠成相似的三维空间结构 运用同源模型方法可以完成所有蛋白质运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工

13、作的空间结构预测工作 基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来,然而要想了解它们的功能,只有氨基酸序列是远远不够的,因为蛋白质的功能是通过其三维高级结构来执行的,而且蛋白质三维结构也不蛋白质三维结构也不一定是静态的,在行使功能的过程一定是静态的,在行使功能的过程中其结构也会相应的有所改变中其结构也会相应的有所改变。因此,得到这些新蛋白的完整、精确和动态的三维结构就成为摆在我们面前的紧迫任务。目前除了通过诸如X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法得到蛋白质三维结构蛋白质结构蛋白质结构 另外一种广泛使用的方法就是

14、通过计算机辅助预测的方法,目前,一般认为蛋白质的折叠类型只有数百到数千种,远远小于蛋白质所具有的自由度数目,而且蛋白质的折叠类型与其氨基酸序列具有相关性,这样就有可能直接从蛋白质的氨基酸序列通过计算机辅助方法预测出蛋白质的三维结构 新药设计新药设计 蛋白质与蛋白质与DNA 的结合的结合基因基因-蛋白相互作用网络蛋白相互作用网络生物信息学的研究意义生物信息学的研究意义生物信息学将是生物信息学将是21世纪生物学的核心世纪生物学的核心 认识生物本质认识生物本质了解生物分子信息的组织和结构,破译基因了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系组信息,阐明生物信息之间的关系改变生物学的研究方式改变生物学的研究方式 改变传统研究方式,引进现代信息学方法改变传统研究方式,引进现代信息学方法在医学上的重要意义在医学上的重要意义为疾病的诊断和治疗提供依据为疾病的诊断和治疗提供依据为设计新药提供依据为设计新药提供依据

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号