生物信息学复习提纲解

上传人:第*** 文档编号:38754815 上传时间:2018-05-07 格式:PDF 页数:7 大小:176.68KB
返回 下载 相关 举报
生物信息学复习提纲解_第1页
第1页 / 共7页
生物信息学复习提纲解_第2页
第2页 / 共7页
生物信息学复习提纲解_第3页
第3页 / 共7页
生物信息学复习提纲解_第4页
第4页 / 共7页
生物信息学复习提纲解_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《生物信息学复习提纲解》由会员分享,可在线阅读,更多相关《生物信息学复习提纲解(7页珍藏版)》请在金锄头文库上搜索。

1、生物信息学生物信息学重要概念重要概念1、生物信息学的定义、研究内容、组成 定义:生命科学与数学、计算机科学、信息科学交叉融合的新兴学科。 OR用计算机储存、比较、提取、分析、预言、模拟生物分子的组成与结构。研究内容: 基础研究: 数学:模型、算法 IT:数据库、计算机软硬件开发 应用 服务生命科学研究:序列分析组成:生命科学、数学、计算机科学、信息科学2、推动生物信息学快速发展的学科 核心与灵魂:生命科学 基本工具:数学与计算机技术3、“组”学的主要创新点对生命科学发展的作用与意义 所谓组学,即从一个整体的角度来研究。相对于传统生命科学零碎敲打的研究手段, 研 究单个的基因或蛋白的功能、结构,

2、而组学则是着眼于大局,将单个的基因、蛋白以“组” 的水平进行研究,从而对于生命科学能够有一个大局的把握。4、生物信息学对生命科学发展的作用与意义 作用: 从学科角度方面:生命科学进入了新的发展时期;研究体系的突破局 部到整体;学科性质经验型、资料积累到总结规律 从研究人员角度:提高研究效率,深化研究成果、显著提升研究工作的意 义与价值 意义:极大提高科研的效率、质量,促进生命科学实现跨越式的发展5、世界上最权威的四大生物数据平台 美国人工蛋白质数据库、GenBank 数据库、欧洲分子生物学实验室(EMBL) 、日本核 酸序列数据库(DDBJ)6、检索工具法 直接利用检索工具检索文献信息的方法,

3、又分为顺查法、倒查法、抽查法7、追溯法利用已知的文献末尾所列的参考文献为线索, 进行逐一地追溯查找引文的一种最简便的 扩大信息来源的方法8、分段法 先利用检索工具进行常规检索, 再利用文献后附参考文献进行追溯检索, 分期分段地交 替使用这两种方法9、文献检索的主要途径 分类途径、主题途径、著者途径和其他途径(各种号码索引、专用符号代码索引、专用 名词术语索引)10、BLAST 的中英文全名 Basic local alignment search tools = 局部序列比对基本检索工具11、比对 排列两个或以上的序列,使其最大化利于分析序列的同源性和相似性等12、局部比对与整体比对在打分矩阵

4、方面的主要区别、用途 全局比对:空位罚分对空位出现的位置不加区别 进化分析、蛋白质三维结构或折叠方式 准全局比对:避免对序列一端或两端出现的空位进行罚分 在较长序列中搜索较短序列 局部比对:对空位的位置加以区分,小于零时归零,回溯重建比对,直到遇上零为止 搜索序列中短的保守片段(高灵敏度地发现短的保守序列)13、相似性与同源性 同源性:定性描述 同源序列指由共同祖先基因或序列经趋异进化而形成的多个基因或序列 相似性:定量描述 通过序列比对过程中用来描述检测序列和目标序列之间相同 DNA碱基或氨基酸残基序 列所占比例的高低14、序列比对的主要应用 数据库搜索最常见用途 通过对海量序列数据库的搜索

5、,找出与提交序列相似的序列 多序列比对进化树构建 发现特定基因家族的保守区段:同源克隆基因,利用 RNAi 沉默目标基因、基因功 能结构域分析 分子系统发生分析15、BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTP?程序数据库查询BLASTN核酸核酸BLASTP蛋白蛋白BLASTX蛋白核酸-蛋白tBLASTN核酸-蛋白蛋白tBLASTX核酸-蛋白核酸-蛋白16、分子钟 氨基酸的匀速变异现象 基本规律:(1)不同类的基因间的氨基酸替换率存在显著差异 (2)同类的分子进化速率则几乎完全一致 同源蛋白质的差异取决于它们独立演化的时间 不同物种中的同源基因的进化速率不同17、有

6、根树 不仅明确节点之间的相互关系, 同时确定哪个节点是其他节点的共同祖先或最早从共同 祖先中分化出来的18、无根树 只表明了节点之间的关系,没有确定某个共同祖先以及节点之间的进化关系19、外类群 利用已有的进化信息, 人为地引入已知的与被分析群体中进化关系最远的基因序列或物 种20、确定树根的主要方法 外类群法,引入与被分析群体中进化关系更远的基因序列或物种; 中点法,取最长的路径的中点(假设所有分支拥有基本相同的进化速率) ; 倍增基因法,分析时引入成对的倍增基因(同源旁系基因) 。21、进化树构建的数据种类 特征数据:存在有限不同状态的特征;描述性,定性; 来自解剖学、 生理、 行为研究的

7、数据 (如个体颜色、 对某个刺激的反应时间等) 距离数据:两个数据集之间具有可衡量的差异 以 DNA、蛋白质序列数据为主22、进化树构建的主要方法、各自的原理及优缺点 基于特征符: 最大简约法 MP 原理:需找具有最少核酸或氨基酸替换的进化树 优点:正确性效率兼顾 缺点:受长枝效应影响大最大似然法 ML 原理:考察每个位点出现残基的似然值,产生特定位点的似然值,计算似然函数, 值最大的树即为最可能的系统发生树。 优点:完全基于统计分析,在每组序列比对中考虑了每个氨基酸替换的概率 缺点:计算量最大 基于距离:非加权配对组算术方法 UPGMA、邻近归并法 NJ、Fitch-Margoliash F

8、M、 最小进化方法 ME 原理:根据双重序列比对的差异程度(距离) 优点:使用序列进化模型、计算强度小、充分考虑不可见突变 缺点:屏蔽了真实的特征符数据23、进化树质量评价的主要方法 重复取样法: 从原有数据中产生假重复数据。 用多次抽样产生的新数据构建系统树, 每一个内部分支出现的次数与该分支的可靠程度呈正相关 自举法 整体评价法:用一致性指数 lc 和保持性指数 lr 来衡量。 lc = R / Llc 越大,同塑型的比例越小,系统树越可靠 R:所有性状的范围的总和,即性状可能变化的最小值 L:给定系统树的最小进化步数24、Domain、fold、motif Domain: 指具有特定且相

9、对独立的三维立体结构、 而且能够独立完成某种功能的蛋白质 的一部分;或指蛋白质序列中的某一保守区段 Fold: 蛋白质基本三维结构,包括:二级结构元件、元件间的顺序连接、元件之间的相 对空间位置 Motif: 在 DNA 或蛋白质序列上保守的短片段,或蛋白质结构上普遍存在的保守立体结 构元件概念比较结构层次稳定性完整结构独立功能motif二级不稳定否否domain三级不稳定否是fold三级稳定是是25、蛋白质的各级结构的定义 一级结构:氨基酸序列 二级结构:局部多肽链借助氢键排成特有的规则结构 三级结构:由远程肽段折叠产生,一般指多肽链的独立折叠单位经多重盘绕、折叠形成由各种次级键维持的球状结

10、构 四级结构:由若干亚基组装成复杂蛋白26、蛋白质二级结构预测方法根据其原理分类 基于统计:Chou-Fasman 法、GOR 法、最小邻近法、马尔科夫模型、人工神经网络 法 基于知识:Lim 方法、Cohen 方法 混合方法27、蛋白质家族、蛋白质超家族 蛋白质家族:具有相似序列或序列同源性的一组蛋白质 蛋白质超家族:结构组成上有相似的折叠模体构成,但是序列之间几乎不存在相似性28、蛋白质三级结构预测的主要方法 同源建模法(30-40%相似性) 序列相似的蛋白质结构也很有可能相似 蛋白质的三维结构的保守性远大于序列的保守性 找相似度高的已知结构蛋白质 - 序列比对 -建立起近似结构 - 优化

11、 折叠识别法(穿针引线法,相似性不高20%) 蛋白质折叠种类有限 预测折叠模式 - 平均势函数 从头预测法 假设:蛋白质的天然构象对应其自由能能最低 完全根据蛋白质的物理模型进行分子动力学模拟其折叠过程简述题简述题1、生物信息学在生命科学中的地位、作用,及对生命科学的影响应用领域 地位与作用: 从学科角度方面: 研究体系的突破:局部到整体; 学科性质:经验型、资料积累到总结规律 从研究人员角度:提高研究效率,深化研究成果,显著提升研究工作的意义与价值 应用领域: 生命科学研究序列分析;ORF、序列组装;蛋白质结构预测;组学数据分析2、结构生物学 研究核酸、蛋白质等生物大分子结构与功能的新兴学科

12、 生物、物理、化学、计算机科学等一级学科的交叉学科 主要研究对象:核酸、蛋白质、多糖、类脂 在分子层面上对生物大分子的结构研究,阐明重要生命过程的分子机理3、蛋白质结构研究的主要方法 晶体学技术:X 射线衍射、中子衍射技术、电子晶体电子显微镜:透射显微:电子显微镜、近场光镜 扫描显微:激光共聚焦、原子力显微镜 谱学方法:核磁共振、电子自旋共振、激光拉曼光谱4、芯片技术的创新点 量变到质变:并行地做几百几万个 southern 或 northern 局部到整体:生命科学研究从单个基因、孤立地研究发展到多基因组、基因组整体性研 究的崭新阶段 分为基因组分析芯片(检测基因序列的突变和多态)和基因表达

13、谱分析芯片(检测基因 的表达,研究基因的功能)5、经典生物进化与现代分子进化研究的异同传统系统发生分子系统发生分子证据的地位辅助核心证据数量少海量研究成果性质定性、推论定量、统计分析分化时间确定真实推测6、不同种类基因进化速度存在很大差异的分子机理 不同基因功能不同,有些如 HLA、病毒基因等需要更快的进化速率以提高物种的适应 能力,有些基因高度保守,如 16S rDNA 等,突变甚至可能会导致个体的死亡,因此此种基 因进化速率慢。 不同物种间的同源基因的进化速率也不同。 这与不同物种的生存决策不同有关系 (K 对 策和 S 对策) ,还和不同物种的生存环境有关系。 碱基的替换速率基本相同,

14、有些重要基因的突变可能会影响生物体的正常生存, 因此进 化速率慢,对于功能不重要的基因,比较容易积累突变,表现为较大的基因进化速率。7、基因进化树与物种进化树的区别 基因树:基于一种或少数几种同源基因(蛋白)的比较分析而构建的系统发生树,其实 质是基因的进化历史。 物种树: 综合考察物种多方面的进化证据而构建的系统发生树。 物种树一般通过对多个 基因家族的序列比对分析后,综合获得。8、蛋白质结构预测的意义与目的 理论意义: “第二层次遗传密码子” 蛋白质的核酸序列 - 蛋白质三维空间结构 - 蛋 白质功能 应用方面:药物理性设计(蛋白酶、微管蛋白、受体) 、酶工程9、蛋白质结构预测的生物学证据 依据蛋白质的一级结构(序列)推测蛋白质的三维空间结构。 实验证据:核糖核酸酶的折叠实验 (1)核酸酶变性或者说蛋白质高级结构被破坏后,其活性随之消失; (2)在一定的实验条件下,变性的核酸酶可以自发地重新折叠恢复到原来的结构,同时其酶活也随之恢复10、蛋白质折叠过程中的关键作用力 范德华力、氢键、盐键、疏水作用、二硫键注:满分诀窍!学弟学妹们!考试时心中默念瑞根最犀利即可得高分!学长亲测!效果未知!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号