双序列比对的方法

上传人:鲁** 文档编号:567707116 上传时间:2024-07-22 格式:PPT 页数:71 大小:1.60MB
返回 下载 相关 举报
双序列比对的方法_第1页
第1页 / 共71页
双序列比对的方法_第2页
第2页 / 共71页
双序列比对的方法_第3页
第3页 / 共71页
双序列比对的方法_第4页
第4页 / 共71页
双序列比对的方法_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《双序列比对的方法》由会员分享,可在线阅读,更多相关《双序列比对的方法(71页珍藏版)》请在金锄头文库上搜索。

1、双序列比对郭志云Email:1奔栈赢费萎乐诣庇疏呵惧节渺硬短恍行湘偷六虎匪耳猎兴激赔两挚烯湖窘双序列比对的方法双序列比对的方法课程主线o序列比对基本概念o空位罚分o相似性与同源性o双序列比对方法n点阵序列比较(Dot Matrix Sequence Comparison)n动态规划算法(Dynamic Programming Algorithm)o记分矩阵2阴吐志猩娇绰启劣玖库斗脂蚕掀晾私鼠呛辅窍鼠坛迁围痈亡冗帝咱煌牌座双序列比对的方法双序列比对的方法什么是序列比对?o序列比对(Sequence Alignment)是通过在序列中搜索一系列单个性状或性状模式来比较2个(双序列比对)或更多(多重

2、序列比对)序列的方法o按比对序列条数分类n双序列比对:两条序列的比对n多序列比对:三条或以上序列的比对3身锑及交昔被砰琵豌牟乳塔望阶溪指愉崎卡武运靛闰朝辰皖屿矿点樟戌眠双序列比对的方法双序列比对的方法我们为什么关注序列比对?o相似的序列可能具有相似的功能与结构o发现一个基因或蛋白哪些区域容易发生突变,哪些位点突变后对功能没有影响 o发现生物进化方面的信息4针李搁冗蛛化甥掘映孟井晶洁蛇登园滞项鹿站栓药哦拱涧论糊茧晾糜殆脑双序列比对的方法双序列比对的方法序列比对两种类型o全局序列比对全局序列比对l定义:在全局范围内对两条序列进行比对打分的方法l适合于非常相似且长度近似相等的序列o局部序列比对局部序

3、列比对l定义:一种寻找匹配子序列的序列比对方法 l适合于一些片段相似而另一些片段相异的序列5荧钒墩磊罕屑夯农廖涧占札丁凯闻风瓶溉报瓣蜀涧贰漠锨摧人荣反庄豆殷双序列比对的方法双序列比对的方法序列比对两种类型6抓往搏甭迷卡诊习酶铰辉氮腾革仇汕疤抄鹤侧炬锭灿事里琐韵鞘暂固哟很双序列比对的方法双序列比对的方法空位罚分(Gap Penalties)o空位为了获得两个序列最佳比对,必须使用空位和空位罚分o空位罚分分类:n空位开放罚分(Gap opening penalty)n空位扩展罚分(Gap extension penalty)o最优的序列比对通常具有以下两下特征:n尽可能多的匹配n尽可能少的空位o插

4、入任意多的空位会产生较高的分数,但找到的并不一定是真正相似序列7札餐芜遇哆籽卡辈竹凉朵眯逸管沮席乱掸卤如臻凸磨差扦膜息麓闹泉凉浦双序列比对的方法双序列比对的方法1 GTGATAGACAC | 1 GTGCATAGACAC空位罚分允许空位但不罚分不允许有空位 match = 5mismatch = -41 GTG-ATAGACAC | |1 GTGCATAGACAC1 GTG-ATAGACAC | |1 GTGC-ATAGACAC?Score: -21Score: 558羽绸拯剃亨计椎邦乔本崇舅铲契菩监副窟殖榆煎汐抬够脐模狗颅密晓李哥双序列比对的方法双序列比对的方法空位罚分公式 A T G T

5、T A T A CT A T G T G C G T A T A Score=4参数:匹配匹配= 1非匹配非匹配= 0g= 3r = 0.1x = 3score:8 - 3.2 = 4.8Wx=g+r(x-1)Wx:空位总记分g:空位开放罚分r:空位扩展罚分x:空位长度T A T G T G C G T A T A insertion / deletionA T G T - - - T A T A CWx= -3 - (3 -1) 0.1 = -3.29拒缝蚜移钠琢止威碳疥缀慢谈防吏瓜模艇尤恋斋念供兜屿猾蒙围烦促堆棕双序列比对的方法双序列比对的方法双序列比对方法o点阵序列比较 (Dot Mat

6、rix Sequence Comparison)o动态规划算法 (Dynamic Programming Algorithm)o词或K串方法 (Word or K-tuple Methods)10缎银泥臣耀羊羡挖滁沦痊癌亨逾硷踩掉淑苟檀烃耗囚徽孪牟才哎描曙掀郑双序列比对的方法双序列比对的方法点阵序列比较o点阵(Dot Matrix)分析是一种简单的图形显示序列相似性的方法o沿X轴上序列1中的每一个单元(核苷酸或氨基酸)与沿Y轴的第二个序列中的每一个单元进行比较,相同的区域在点阵图中显示为由点组成的对角线,对角线之外零散的点为背景噪音11比汪筑抉悍于役哪烤诡剪炬屹雇乞澜倍蒋登峭颠灶们夫夯镣懂贪并

7、奥汪黄双序列比对的方法双序列比对的方法IONIZATIONIONIZATION12沿擒涣过惕剔钟固滥富砾掉虐抄糠头拘遵言趋碧纹沥芬卧彰恕尊箩船邯俏双序列比对的方法双序列比对的方法IONIZATNOIIONIZATNOI13碧惶爬审屑果锋挛子攫幻泼弄怜了戍液军武浊鸳颇息啼港滇玩愤憎帐游谅双序列比对的方法双序列比对的方法点阵分析的应用o自身比对n寻找序列中的正向或反向重复序列n蛋白质的重复结构域(domain)n相同残基重复出现的低复杂区(Low Complexity)nRNA二级结构中的互补区域等o对两条序列的相似性作整体的估计14苫出疚凸区斩斜切垮疹箭腑炽诧显派纱蜗侦炬郁错喧义缴卑期陛雏修刘拢

8、双序列比对的方法双序列比对的方法点阵分析中的插入或删除TACTGTCAT T A C T G T T C A TSequence 1Sequence 2T A C T G - T C A T| | | | | | | | |T A C T G T T C A T插入空位插入空位15垦秦俩秦静杖优籍牙寐哪遥丢傈走箭困兰焦环宜厦售吾蛇些垃蘑芍量速沁双序列比对的方法双序列比对的方法点阵分析的应用人类低脂受体(human low-density lipoprotein receptor)自身比对发现正向重复序列具有连续相似区域的两条DNA序列的简单点阵图正向重复16愈办祝县备忙窍驹戒嚼缘羌牌申腰聘循勉

9、塞藤业伯忍怜阁做汉芜垮鹤竣挺双序列比对的方法双序列比对的方法点阵分析实例o编码噬菌体c(水平轴)和噬菌体P22 c2(垂直轴)的氨基酸序列间的点阵分析o相同的点打印全部打印,很难找到有用的信息17烁杆拜漳板箩渡狮窒弃字自绢襟汰葛隆履糊抵召钟熄涅脖婶码博很巢鸡梭双序列比对的方法双序列比对的方法使用滑动窗口技术降低噪声T A C G G T A T G A C A G T A T CT A C G G T A T G A C A G T A T CT A C G G T A T G A C A G T A T CT A C G G T A T G A C A G T A T CC T A T G

10、A C A T A C G G T A T GWindow=3 Word Size = 318嫩腐缀邀君芭伤匣计幸每苦彰篡扎呼渊氨颐珠竭磐相另鸯遇汞坎褂岗洞财双序列比对的方法双序列比对的方法ATACTACAAGACACGTACCGG C G A T G C A T T G A G T A T C A T AWindow size = 5Stringency = 3Match = 1 Mismatch = 019同轮临砾隶凤霄庸战溪擦书孙湛堵拳拳娃蛤糠岿貌衷靠生蓑聋侥免邑湿惜双序列比对的方法双序列比对的方法ATACTACAAGACACGTACCGG C G A T G C A T T G A G

11、 T A T C A T AWindow size = 5Stringency = 3Match = 1 Mismatch = 020娄罐斗拨沼态彝携鳞顺舒梯忻费祖呛肚亡煎肚咱挣钩摹愉单霖夸矩鸯灿伯双序列比对的方法双序列比对的方法ATACTACAAGACACGTACCGG C G A T G C A T T G A G T A T C A T AWindow size = 5Stringency = 3Match = 1 Mismatch = 021炙炙王唁潞互响口冶珊捎阎阿棋恿矫旗针功糊邮钳涣栽贩蒸躁娜桥铃将熏双序列比对的方法双序列比对的方法G C G A T G C A T T G A G

12、 T A T C A T AATACTACAAGACACGTACCGWindow size = 5Stringency = 3Match = 1 Mismatch = 022征谩亿倦暂砍轴贿尝泡浪玛谎佛扔申忍鼓吟俗爷追拷脉搓衫浅掏裸搪酪睹双序列比对的方法双序列比对的方法G C G A T G C A T T G A G T A T C A T AATACTACAAGACACGTACCG23百切脉媳晋胃麓傀不宛泳盖丸园缚读鬃弘帖链咨棕劳胺间辑峡箩啦吴棕症双序列比对的方法双序列比对的方法G C G A T G C A T T G A G T A T C A T AATACTACAAGACACGTA

13、CCG24先吼重哗蜒沂甲坠袜严挨呸嫡恳风嘎谬选腐绘链缓陇绢废志咸足屹唐疯萤双序列比对的方法双序列比对的方法使用滑动窗口技术降低噪声(a)对人类(Homo sapiens)与黑猩猩(Pongo pygmaeus)的球蛋白基因序列进行比较的完整点阵图(b)利用滑动窗口对以上的两种球蛋白基因序列进行比较的点阵图,其中窗口大小为10个核苷酸, 相似度阈值为8,即10个核苷酸中有8个相同时就打一个点ab25幌绽妄藏揩岔秃帆分笺霄疲转第留胚即作长车谅脏啦字蕾杠敛荒征聚沂笛双序列比对的方法双序列比对的方法点阵分析的优缺点o优点n直观性,整体性n点阵分析不依赖空位(gap)参数,可寻找两序列间所有可能的残基匹

14、配n不依赖任何先决条件,是一种可用于初步分析的理想工具n点阵分析允许随时动态地改变最高和最低界限值,可以用来摸索区分信号和背景标准的严格程度26破挠坏隘陋菏尊伸匆葛琐宫再北送峻盖础颂汲钎独责浚徽目辜艳赌柔娥摸双序列比对的方法双序列比对的方法点阵分析的优缺点o缺点n不能很好地兼容打分矩阵n滑动窗口和预值的选择过于经验化n信噪比低 n不适合进行高通量的数据分析27突肛羡摧浮痕王抚涪蝇证网扑呀掩卞瓢擒呻惯硫捶按院酚庐致便偶袄享馅双序列比对的方法双序列比对的方法点阵分析程序oDNA Strider (Macintosh)nhttp:/ oDotter (Unix/Linux, X-Windows)oC

15、OMPARE, DOTPLOT (GCG软件)oPLALIGN (FASTA)oDotletnhttp:/www.isrec.isb-sib.ch/java/dotlet/Dotlet.html28钟沧贾辽未拴招悦胖到掉未掉忱析榆蚕晃道众偿捐塌韦窟系讼篓像燎芦黍双序列比对的方法双序列比对的方法29渐笆谷赋妊俯摹谋郸斋脆兆背碳釉谍啃淋站悬临劝幻脐胶磺吩无瓷坤跳讥双序列比对的方法双序列比对的方法动态规划算法o动态规划算法(Dynamic Programming Algorithm)是一种计算方法,它的主要思路是把一个问题分成若干个小问题来解决o在生物学中应用的两种动态规划算法:Needleman-

16、Wunsch算法(全局比对)和Smith-Waterman算法(局部比对)30慷獭启轨裹恃碴晦洒众轰酗完判雨寡徽违手甘蔽洞痈强佃漓帚线馏弘惧酝双序列比对的方法双序列比对的方法序列比对中某一位点匹配的三种可能性序列比对中某一位点匹配的三种可能性oEg. 匹配=1,非匹配=0, 空位罚分=-1nSequence1: CACGAnSequence2: CGA第一个位点得分剩余序列CC+1ACGAGA-C-1CACGAGAC-1ACGACGA31摊剐案抓萄脐曝招反经舅抛为入既簿柒面癌剪蚊乘怠达甄前鹃春绒王纱图双序列比对的方法双序列比对的方法动态规划算法的正式表述Si,j这个位置的分数为图中箭头所示三个

17、方向值中最大的一个i -xi -1j -1i -yji Si - x,j - wx Si 1, j- 1 + s(ai , bj)Si, j - y - wy Si, j 32凉蛤创毛游尽惊凌祖抑仰朱堑得厩赫呻膀懈弯何后廓孕耕责桨掠计霍倡挝双序列比对的方法双序列比对的方法动态规划算法的数学形式Sij=maxSi-1,j-1,+s(aibj),maxx1 (Si-x,j-wx),maxy 1 (Si,j-y-wy)Sij=maxSi-1,j-1,+s(aibj),maxx1 (Si-1,j-wx),maxy 1 (Si,j-1-wy)公式一的简化公式一公式二说明:Sij是序列a在位置i和序列b在

18、位置j的分值, s(aibj)是位置i 和j上比对分值,wx是在序列a 中长度为x的间隔罚分,wy是序列b中长度为y的间隔罚分33疙局匙宙伯涣扫牢架杜娜柑教破纂莎碗守屠累庄铣蝇远诅剖致阻泅管爸蔚双序列比对的方法双序列比对的方法动态规划算法实例ACTTCGACTAG匹配3错配-1空位-234沫瑞理锡赣坷桑谴瓶坎撼改旭组酬壬恐随摩胁必骨州吨剑册蹲站斩闭轩邮双序列比对的方法双序列比对的方法ACTTCG0ACTAG动态规划算法实例匹配3错配-1空位-235整咋金诵拇滇蛛腊松莽迢喉擅谢案惊穗隆酞刮秸耳凉经羊遗令停爽咙鼻煤双序列比对的方法双序列比对的方法ACTTCG0-2ACTAG动态规划算法实例匹配3错

19、配-1空位-236靴装狡仑发童徒棵班庐魁鼠彩甲使流馋磁罕猩阑飞持慌艇致至玉揩大丑赠双序列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12ACTAG动态规划算法实例匹配3错配-1空位-237祈筹服筹遥酮隙舷恩奄花皱昂庄缠接靖液盟哥汁螟汝舶价贪笨晌衣绪傍矽双序列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12A-2CTAG动态规划算法实例匹配3错配-1空位-238顺驮狙走台劝牵捶割阉赴茫饶拉苫韦菊谷毙徐龋聋涛宇棺瘫尘脱虽正瞅彩双序列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12A-2C-4T-6A-8G-10动态规划算法实例?S(2,2

20、)-2+(-2)-2+(-2)0+3匹配3错配-1空位-239阶悉镶搞挨驯逃将秘缨浦榨绣叹祈髓帧涩笋痹峻顶谜席匡男筑诣社弗拄洞双序列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12A-23C-4T-6A-8G-10动态规划算法实例?S(2,3)-4+(-2) 3+(-2)-2+(-1)匹配3错配-1空位-240涧镐源鳞帕俗吏乒罩珍汲消凋鸣伞俏漾倘建共吏舟技界符辞质盈桓皮臀仔双序列比对的方法双序列比对的方法动态规划算法实例ACTTCG0-2-4-6-8-10-12A-231C-4T-6A-8G-10匹配3错配-1空位-241未退翻择兼既拱蜀佩梧颖牌舱旦拇瞒匀要鹏痞备车低袁卿摹

21、徒少死扣纂姜双序列比对的方法双序列比对的方法动态规划算法实例ACTTCG0-2-4-6-8-10-12A-231-1-3-5-7C-416420-2T-6-14?A-8-3 2G-10-50S(4,4) 4+(-2) 4+(-2) 6+3匹配3错配-1空位-242慌撵贾驾垛奢尘鹤散秒怂焚瞎来鸣泊札枣脂校荔眩漱拿岔坐皆里拂哎旦档双序列比对的方法双序列比对的方法动态规划算法实例ACTTCG0-2-4-6-8-10-12A-231-1-3-5-7C-416420-2T-6-149A-8-3 2G-10-50匹配3错配-1空位-243缮桐坑妊竿款劝贞挺掂吱衣迁匹撮泳腾糠荷钟吠向蹲福锥缉滞赫颇慕自郎双序

22、列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12A-231-1-3-5-7C-416420-2T-6-149753A-8-3 27864G-10-505679GGT-CATTCCAA回回 溯溯44铅逮厢木弛挛肌服乙豺码靖筋梭赃欺擦韩枚菇烃傲瓣赫费撂脑朱笋生拜廊双序列比对的方法双序列比对的方法ACTTCG0-2-4-6-8-10-12A-231-1-3-5-7C-416420-2T-6-149753A-8-3 27864G-10-505679GGT-CATTCCAA45拆龙艇妮虹低息拐片似俯葱刻累平花亲化窘协阻烽牢班醛眶帧耕枉坪术颤双序列比对的方法双序列比对的方法ACTTC

23、G0-2-4-6-8-10-12A-231-1-3-5-7C-416420-2T-6-149753A-8-3 27864G-10-505679GGTAC-TTCCAA46搂哟桐腹荚狼钥歹伶拔郧簇纠朗驮茅痛伎软找荧乔庆比羞仰幼菠旨哑疏盆双序列比对的方法双序列比对的方法比对结果1.ACTTCGAC-TAG2.ACTTCGACT-AG3.ACTTCGACTA-G哪一个是最优比对哪一个是最优比对(optimal alignment)呢呢?记分矩阵47簿抒伴慧衔褥雁子箕骚讨钒痘揪籽椰琼交盗坤康辞指父缓脆堤残葱配例筛双序列比对的方法双序列比对的方法Needleman-Wunsch算法Seq1: MPRCL

24、CQRJNCBASeq2: PBRCKCRNJCJA匹配匹配=1,错配,错配=0,空,空位罚分位罚分=048晌福句柳秦讼码扶超般帘撰物盾厢膳乞舷北易巡吃握部驾苫著兴锚涸旗掉双序列比对的方法双序列比对的方法Needleman-Wunsch算法Seq1: MPRCLCQRJNCBASeq2: PBRCKCRNJCJA求出阴影部分所能达到的最大值填入当前位置,并记下到达这一位置的路径49纸载般阴荷曳呈匠巷蒋甭儡笨左钥堡贝峭商假捂庇沧喀唯武慢奄蛹培贴左双序列比对的方法双序列比对的方法Needleman-Wunsch算法Seq1: MPRCLCQRJNCBASeq2: PBRCKCRNJCJA550里夫

25、殷凭匿烤襟铺争凤平痞君橇暂宇酮刀啃敷奶哥纫箕台烷伟惊寒尿淮矿双序列比对的方法双序列比对的方法Needleman-Wunsch算法 MPRCLCQRJNCBA PBRCKCRNJCJAResult:51姓贫土成徒吉错嘛特绅原沧亭址袄染部豫芝好谆碧夜兹肃夺朴肘摸勉筐燎双序列比对的方法双序列比对的方法 F(i-1,j-1) + s(ai, bj), F(i,j)= max F(i,j-1)-wy, F(i-1,j)-wx.0动态规划算法Smith-Waterman 算法Smith-Waterman算法52她遍忧疫胶屹簇烫毖瓶恩我径劈朴桩役悟沟坪邢浇嗣泅海蜀猾龟瓜肋阴挫双序列比对的方法双序列比对的方法

26、Smith-Waterman 算法AACCTATAGCT000000000000G000000000100C000110000021G000000000101A011000101000T000001021001A011000203210T000001132212A011000224321匹配匹配=1非匹配非匹配=-1空位空位=-153衡臀叙诡只泥撬瑶奢艘迎诣魁涉萧丽坑炳色成橡誉钦戈嗜倍肛援腰达赶报双序列比对的方法双序列比对的方法Smith-Waterman 算法AACCTATAGCT000000000000G000000000100C000110000021G000000000101A0110

27、00101000T000001021001A011000203210T000001132212A011000224321A A C C T A T A G C T- G C G A T A T A - - -匹配匹配=1非匹配非匹配=-1空位空位=-154淤护榴疽坪踏跪俄橡衬也屉若掇胺附徐逮喊眷残束音欲屑裁擂光酉烙虽木双序列比对的方法双序列比对的方法oGenetics Computer Group (GCG) 程序 GAP (Needleman-Wunsch algorithm) and BESTFIT (Smith-Waterman algorithm)o最相似的比对表示为 :, 较相似的表

28、示为 . 无相关的表示为空格, carboxy-terminal55踩甘捅炮煤悸年斟妆唁佛影侨酬皖戳桌宜适篙退赢襟帆柒判屿荡纽铱茶疫双序列比对的方法双序列比对的方法记分矩阵与空位罚分oDNA计分矩阵o蛋白质计分矩阵o广泛使用的两种矩阵n PAM n BLOSUMo空位罚分56饵警酝舱植皱昼雁过弗毁卤高咱启讫堑琢模俯升裴哑龟拱畅旗空牟辗粕拽双序列比对的方法双序列比对的方法记分矩阵(SCORING MATRICES)oDNA Scoring MatricesoAmino Acid Substitution MatricesnPAM (Point Accepted Mutation) nBLOSUM

29、 (Blocks Substitution Matrix)57三电翁反潍兰碴筋喇壳形狸亚揖滁糯疤拆合拌拄际咯娩勋讶敝涵坡月求挫双序列比对的方法双序列比对的方法DNA计分矩阵actaccagttcatttgatacttctcaaataccattaccgtgttaactgaaaggacttaaagactSequence 1Sequence 2AGCTA1000G0100C0010T0001匹配: 1错配: 0分值:558浅毁滔器帝流洱挎援慢但渡辐货戚订窝页恤奥碰蝗德肿植了拉释瘪篱高疚双序列比对的方法双序列比对的方法转换和颠换CTAG嘧啶嘌呤 表示转换(transition),表示颠换(transv

30、ersions)转换比颠换更容易发生59铝递床眨惮练墟伙肘张镐塑遗耳路刁旗蛛缚玛呵技巳杉曝醒望诲恃湘饼契双序列比对的方法双序列比对的方法转换和颠换AGTCA0.99G0.0060.99T0.0020.0020.99C0.0020.0020.0060.99转换速率是颠换3倍时的模型60子刷闲容汞惦琅帐万吏儡地哦粹配秃胰辑蛙膜直贺盐胶屏氨沁寐俩迷亏骋双序列比对的方法双序列比对的方法蛋白质计分矩阵PTHPLASKTQILPEDLASEDLTIPTHPLAGERAIGLARLAEEDFGMSequence 1Sequence 2记分矩阵T:G= -2 T:T = 5Score= 48 CSTPAGND

31、.C 9S-1 4T-1 1 5P-3-1-1 7A 0 1 0-1 4G-3 0-2-2 0 6N-3 1 0-2-2 0 5D-3 0-1-1-2-1 1 6 . CSTPAGND.C 9S-1 4T-1 1 5P-3-1-1 7A 0 1 0-1 4G-3 0-2-2 0 6N-3 1 0-2-2 0 5D-3 0-1-1-2-1 1 6 .61莉正稠双铰愿驹违责党套顺整剔迭胜茬符帕疯属训偷罪绞捎霄蓄舵爆搐置双序列比对的方法双序列比对的方法PAM( Percent Accepted Mutation)矩阵o氨基酸容易被其它生化、物理特性相似的氨基酸替换oPAM1(1个PAM单位)被定义为

32、每100个残基出现一个被接受的点突变(氨基酸的置换不引起蛋白质功能上的显著变化)oPAMn是PAM1自乘n次oPAM250、PAM120、PAM80和PAM60矩阵可用于相似性分别为20%、40%、50%和60%的序列比对62挑汾倦恼拭蓬屯落诸姐浆拱章享姬售蕴鸟蹦挠炸胰军斥豢痘坦弊散省邹嘿双序列比对的方法双序列比对的方法 A R N D C Q E G H I L K M F P S T W Y V B ZA 2 -2 0 0 -2 0 0 1 -1 -1 -2 -1 -1 -3 1 1 1 -6 -3 0 2 1 R -2 6 0 -1 -4 1 -1 -3 2 -2 -3 3 0 -4 0

33、 0 -1 2 -4 -2 1 2 N 0 0 2 2 -4 1 1 0 2 -2 -3 1 -2 -3 0 1 0 -4 -2 -2 4 3 D 0 -1 2 4 -5 2 3 1 1 -2 -4 0 -3 -6 -1 0 0 -7 -4 -2 5 4 C -2 -4 -4 -5 12 -5 -5 -3 -3 -2 -6 -5 -5 -4 -3 0 -2 -8 0 -2 -3 -4 Q 0 1 1 2 -5 4 2 -1 3 -2 -2 1 -1 -5 0 -1 -1 -5 -4 -2 3 5 E 0 -1 1 3 -5 2 4 0 1 -2 -3 0 -2 -5 -1 0 0 -7 -4

34、-2 4 5 G 1 -3 0 1 -3 -1 0 5 -2 -3 -4 -2 -3 -5 0 1 0 -7 -5 -1 2 1 H -1 2 2 1 -3 3 1 -2 6 -2 -2 0 -2 -2 0 -1 -1 -3 0 -2 3 3 I -1 -2 -2 -2 -2 -2 -2 -3 -2 5 2 -2 2 1 -2 -1 0 -5 -1 4 -1 -1 L -2 -3 -3 -4 -6 -2 -3 -4 -2 2 6 -3 4 2 -3 -3 -2 -2 -1 2 -2 -1 K -1 3 1 0 -5 1 0 -2 0 -2 -3 5 0 -5 -1 0 0 -3 -4 -2 2

35、 2 M -1 0 -2 -3 -5 -1 -2 -3 -2 2 4 0 6 0 -2 -2 -1 -4 -2 2 -1 0 F -3 -4 -3 -6 -4 -5 -5 -5 -2 1 2 -5 0 9 -5 -3 -3 0 7 -1 -3 -4 P 1 0 0 -1 -3 0 -1 0 0 -2 -3 -1 -2 -5 6 1 0 -6 -5 -1 1 1 S 1 0 1 0 0 -1 0 1 -1 -1 -3 0 -2 -3 1 2 1 -2 -3 -1 2 1 T 1 -1 0 0 -2 -1 0 0 -1 0 -2 0 -1 -3 0 1 3 -5 -3 0 2 1 W -6 2 -

36、4 -7 -8 -5 -7 -7 -3 -5 -2 -3 -4 0 -6 -2 -5 17 0 -6 -4 -4 Y -3 -4 -2 -4 0 -4 -4 -5 0 -1 -1 -4 -2 7 -5 -3 -3 0 10 -2 -2 -3 V 0 -2 -2 -2 -2 -2 -2 -1 -2 4 2 -2 2 -1 -1 -1 0 -6 -2 4 0 0 B 2 1 4 5 -3 3 4 2 3 -1 -2 2 -1 -3 1 2 2 -4 -2 0 6 5 Z 1 2 3 4 -4 5 5 1 3 -1 -1 2 0 -4 1 1 1 -4 -3 0 5 6 PAM 25063眺曰仲素茧

37、喂诡消华劈悦赞柳福萄欧谢趟搽袜芍遵瞄筋搞条痘肆案眩哭与双序列比对的方法双序列比对的方法 u模块替换矩阵BLOSUM以序列片段为基础,它是 基于蛋白质模块(Block)数据库而建立起来的 u 在模块比对的每一列中,分别计算 两两氨基酸的变化情况,来自所有 模块的数值被用来计算BLOSUM矩阵u矩阵后面的数字表示构建此矩阵所用的 序列的相似程度,如BLOSUM62表示由 相似度为62%的序列构建AACECA - C = 0A - E = -1C - E = -4A - A = 4C - C = 9AACECBLOSUM矩阵 (Blocks Substitution Matrix)64阂聋戳游抉搅俊

38、哆桥玄陷吃锹令浙积什庶矫腆蟹啪樟帧巢窿阴鬃留胯渊胚双序列比对的方法双序列比对的方法BLOSUM62 65屏蚀静降锁氛撮欠朗丸杭甸筏乃柞宙舔唾绥甚业鉴褪泥划咎介亢铬熬鼠规双序列比对的方法双序列比对的方法如何选择合适的评分矩阵?n 一般来说,在局部相似性搜索上, BLOSUM 矩阵较PAM要好n当比较距离相近的蛋白时,应选择低的PAM或高的BLOSUM矩阵;当比较距离较远的蛋白时,应选择高的PAM或低的BLOSUM矩阵 n 对于数据库搜索来说一般选择BLOSUM62矩阵nPAM矩阵可用于寻找蛋白质的进化起源,BLOSUM矩阵用于发现蛋白质的保守域66质迅剥妻巷豫撞辫硼娥切岿猛筷屠过子旨枪始氢市依唬

39、迅项棠端宾卧乳蕴双序列比对的方法双序列比对的方法相似性与同源性n同源性(Homologous Genes) :序列来自共同的祖先,相似的序列往往具有同源性n相似性(Similarity):两序列根据某种参数设定而表现出来的相近性67萨踩歌痘否呼阳钞妨瘴魄黑姥贯毛薯系峪后些承沈春犬眼竞焉猿仕扳奈惜双序列比对的方法双序列比对的方法相似性与同源性的区别o相似的序列并不一定同源o相似性是可以被量化的“计分表”,它是匹配的数量除以比对的长度,通常以百分比%表示o同源性一定是指序列来自共同的祖先o同源性是一个定性的概念,不能使用序列间具有百分之多少同源性来定义68匪篡桩揖硼昆掀卯元因纹桌尖喉要秦陶宿丁滇违威梆篮竹衅渗茧苗技鹰潦双序列比对的方法双序列比对的方法同源性分类n直系同源(Orthologs):具有共同祖先与相似功能的同源基因(无基因复制事件)n旁系同源(Paralogs):两个物种A和B的同源基因,分别是共同祖先基因组中由复制事件而产生的不同拷贝的后代69喉降田遵职炽数教积摇急株刽非损箱然痛某片吁撂掩聪鲤磅飞胆艺纂手釜双序列比对的方法双序列比对的方法So this means 70灸衬含吱铃灯拖周吾嘴氧挪递菌镐戮肆呈逆菇御绿兼久攘颤锹和姻观巍毅双序列比对的方法双序列比对的方法谢谢!71喉膛啃矗箩蒸璃悠箕襟饰屠槽琴泌捧崇肺秉知工聂滥彪憋介庶碴趁奸匝硼双序列比对的方法双序列比对的方法

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号