[补充材料]分子进化的计算分析2

上传人:平*** 文档编号:47574024 上传时间:2018-07-03 格式:PPT 页数:60 大小:4.32MB
返回 下载 相关 举报
[补充材料]分子进化的计算分析2_第1页
第1页 / 共60页
[补充材料]分子进化的计算分析2_第2页
第2页 / 共60页
[补充材料]分子进化的计算分析2_第3页
第3页 / 共60页
[补充材料]分子进化的计算分析2_第4页
第4页 / 共60页
[补充材料]分子进化的计算分析2_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《[补充材料]分子进化的计算分析2》由会员分享,可在线阅读,更多相关《[补充材料]分子进化的计算分析2(60页珍藏版)》请在金锄头文库上搜索。

1、第七章 补充材料分子进化的计算分析内容提要r1. 分子进化及系统发育分析的介绍;r2. 系统发育树的构建方法;r3. MEGA软件的使用;内容提要r1. 分子进化及系统发育分析的介绍;r2. 系统发育树的构建方法;r3. MEGA软件的使用;什么是分子进化r1. 1964年,Linus Pauling提出分子进化理 论; r2. 发生在分子层面的进化过程:DNA, RNA 和蛋白质分子; r3.核苷酸和氨基酸序列中含有生物进化历史 的全部信息;分子进化的模式r1. 单个碱基对的改变,替代,或者点突变; r2. Indels:插入或者缺失; r3. 基因复制:多基因家族的产生以及伪基因的 产生;

2、 A. 单个基因复制 转座或者逆转录; B. 染色体片断复制; C. 基因组复制;分子进化的理论r1. 阳性选择,适应性进化,达尔文进化: DNA分子显著出现非同义替代,改变编码蛋白质 的氨基酸组成,并产生新的功能; r2. 阴性选择,净化选择:DNA分子的同义替 代显著,较少改变蛋白质的氨基酸组成,其原来 的功能高度保守; r3. 中性进化:同义替代与非同义替代比例相当 ,突变不好不坏,不改变或轻微改变蛋白质的功 能。同义替代 vs. 非同义替代GCGGTTTGGGAGGCGGTCTGCGAC 64个密码子,编码20个氨基酸GTT GTC GTA GTGCGT CGC脯氨酸P组氨酸H四倍简并

3、二倍简并TGGTGC色氨酸W半胱氨酸C同义替代非同义替代Ka/Ks:计算及含义r1. Ka:每个非同义位点的非同义替代数目; r2. Ks:每个同义位点的同义替代数目; r3. 一般计算公式:考虑序列上所有可能的同义位点 (S)和非同义位点(N),通过双序列比对发现存在的同 义位点(Sd)和非同义位点(Nd),存在:Ka/Ks:计算及含义 (2)r1. Ka/Ks 1: 中性进化; r2. ka/Ks 1: 阳性选择,适应性进化 r4. 多数基因为中性进化,约1%的基因受到阳性选择- 决定物种形成、新功能的产生。 r5. PAML, MEGA等工具:计算Ka/Ks及统计显著性分子进化研究的目的

4、r1. 从物种的一些分子特性出发,构建系统发育树 ,进而了解物种之间的生物系统发生的关系 tree of life; 物种分类; r2. 大分子功能与结构的分析:同一家族的大分子 ,具有相似的三级结构及生化功能,通过序列同 源性分析,构建系统发育树,进行相关分析;功 能预测; r3. 进化速率分析:例如,HIV的高突变性;哪些 位点易发生突变?系统发育树: 术语祖先节点/ 树根内部节点/分歧点,该 分支可能的祖先结点分支/世系末端节点 ABCDE代表最终 分类,可 以是物种 ,群体, 或者蛋白 质、DNA、 RNA分子等Taxon ATaxon BTaxon CTaxon D116遗传变化Ta

5、xon ATaxon BTaxon CTaxon D时间Taxon ATaxon BTaxon CTaxon D无意义分支图 进化树 时间度量树以上三种类型的系统发育树表示相同的分支状 况,相同的进化关系系统发育树:三种类型AB CD EFG树只代表分支的拓扑结构FGCD EABarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryote通过外围支 来确定树根archaeabacteria outgroup根eukaryote eukaryoteeukaryote eukaryote无根树archaeaarchaeaarchaea无根树,有根树,外围支有

6、根树外围支无根树和有根树:潜在的数目#Taxa 无根树 有根树3 1 3 4 3 15 5 15 105 6 105 945 7 945 10,395 30 3.58X1036 2.04X1038Taxa增大,计算量急剧增加,因此,目前算法都 为优化算法,不能保证最优解内容提要r1. 分子进化及系统发育分析的介绍;r2. 系统发育树的构建方法;r3. MEGA软件的使用;系统发育树重建分析步骤多序列比对(自动比对,手工校正)选择建树方法以及替代模型建立进化树进化树评估系统发育树重建的基本方法r1. 最大简约法(maximum parsimony,MP)r2. 距离法(distance)r3.

7、最大似然法(maximum likelihood,ML)最大简约法(MP)r1. 理论基础为奥卡姆(Ockham)原则:计算所需替 代数最小的那个拓扑结构,作为最优树。 r2. 在分析的序列位点上没有回复突变或平行突变,且 被检验的序列位点数很大的时候,最大简约法能够推 导获得一个很好的进化树。 r3. 优点:不需要在处理核苷酸或者氨基酸替代的时候 引入假设(替代模型)。 r4.缺点:分析序列上存在较多的回复突变或平行突变 ,而被检验的序列位点数又比较少的时候,可能会给 出一个不合理的或者错误的进化树推导结果。信息位点(Sites are informative)r1. 信息位点,必须在至少2

8、个taxa中具有相 同的序列性状。 r2. 信息位点是指那些至少存在2个不同碱基 /氨基酸且每个不同碱基/氨基酸至少出现两 次的位点。上例r1. Position 5, 7, 9为信息位点; r2. 基于position 5的三个MP树: Tree 1长度1 ,Tree 2 & 3长度2; r3. Tree 1更为简约:总长:4; r Tree 2长5;Tree 3长6; r4. 计算结果:MP tree为tree 1.2. 距离法r又称距离矩阵法,首先通过各个物种之间 的比较,根据一定的假设(进化距离模型 )推导得出分类群之间的进化距离,构建 一个进化距离矩阵。进化树的构建则是基 于这个矩阵

9、中的进化距离关系 。一种简单的距离矩阵通过距离矩阵建树的方法r由进化距离构建进化树的方法有很多,常见有: (1) Fitch-Margoliash Method(FM法): 对短支长非常 有效; (2) Neighbor-Joining Method (NJ法/邻接法) :求最短 支长,最通用的距离方法 (3) Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Method (UPGMA法)Fitch-Margoliash方法 (FM法)D和E最接近!分成三组:D, E, 以及ABCDE距离=d+e (1)D到ABC间的平均距离

10、=d+m (2)E到ABC间的平均距离=e+m (3)(2)-(3)+(1)d=4,e=6C最接近DE!分成三组:C, DE, 以及ABc+g+(e+d)/2=19 (1)c+f+(a+b)/2=40 (2)(e+d)/2+(a+b)/2+f+g=41 (2)(1)+(2)-(3)得:c=9c+g+(e+d)/2=19(e+d)/2=5,c=9,则g=5由:(a+b)/2+f+g+(d+e)/2=41 得:f=20由:a+f+c=39 得:a=10,则b=12NJ/邻接法r1. 与FM方法非常类似。 r2. 保证总的支长最短。r总支长:a+b+c+d+e=314/4=78.5找到距离最近的两个

11、点r1.任意两个节点选为相邻序列的总支长计算公式:r2.计算SAB, SBC, SCD, SDE等数值;r3.该例中, SAB最小;把A、B看成一个新的复合序 列,构建一个新的距离表,重复 以上过程。计算A, B的分支长度邻居关系法AB组合出现3次,DE组合出现3次,CD、AC、BC组合各一 次,则AB和DE各为两对关系最近的邻居。(关系最近的邻 居作为邻居的次数最多),将邻居看成一个新的复合序列, 重复这个过程。UPGMA法d=e=10/2=5c=19/2=9.5g=c-d=9.5-5=4.5a=b=22/2=11AB(CDE) A-2239.5 B-41.5 (CDE)-(AB)(CDE)

12、 (AB)-40.5 (CDE)-f1+a=f2+c=40.5/2=20.25f1=9.25 , f2=11.75最大似然法(ML)r1. 最大似然法(maximum likelihood, ML): 最早应用于 对基因频率数据的分析上 r2. 选取一个特定的替代模型来分析给定的一组序列数 据,使得获得的每一个拓扑结构的似然率都为最大值 ,然后再挑出其中似然率最大的拓扑结构作为最优树 。 r3. 在最大似然法的分析中,所考虑的参数并不是拓扑 结构而是每个拓扑结构的枝长,并对似然率求最大值 来估计枝长 。 r4. 缺点:费时,每个步骤都要考虑内部节点的所有可 能性。 r5. 改进:启发式算法。构

13、建进化树的一般原则构建进化树的一般原则 (2)r1. 可靠的待分析数据; r2. 准确的多序列比对; r3. 选择合适的建树方法: A. 序列相似程度高,MP首先; B. 序列相似程度较低,ML首先; C. 序列相似程度太低,无意义。 r4. 一般采用两种及以上方法构建进化树,无显著 区别可接受。选择外围支(Outgroup)r1. 选择一个或多个已知与分析序列关系较 远的序列作为外围支 r2.外围支可以辅助定位树根 r3.外围支序列必须与剩余序列关系较近,但 外围支序列与其他序列间的差异必须比其 他序列之间的差异更显著。进化树的可靠性分析:自展法( Bootstrap Method)r1.

14、从排列的多序列中随机有放回的抽取某一列, 构成相同长度的新的排列序列 r2. 重复上面的过程,得到多组新的序列 r3. 对这些新的序列进行建树,再观察这些树与原 始树是否有差异,以此评价建树的可靠性原始排列Alpha AACAACBeta AACCCCGamma ACCAACDelta CCACCAEpsilon CCAAACBootstrap1 Alpha ACAAAC Beta ACCCCC Gamma ACAAAC Delta CACCCA Epsilon CAAAACBootstrap2 Alpha AAAACCBeta AACCCC Gamma CCAACC Delta CCCCAA

15、 Epsilon CCAACCBootstrap3 Alpha ACAAACBeta ACCCCC Gamma CCAAAC Delta CACCCA Epsilon CAAAAC内容提要r1. 分子进化及系统发育分析的介绍;r2. 系统发育树的构建方法;r3. MEGA软件的使用;MEGA 4.0: 下载及安装r http:/ S. cerevisiaeTPK1KAPA_YEAST TPK2KAPB_YEAST TPK3KAPC_YEAST C. eleganskin-1KAPC_CAEEL D. melanogasterPka-C1KAPC_DROME Pka-C2KDC1_DROME PKA-C3KDC2_DROME CG12069

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号