《中国科技大学课件系列《生物信息学》_1》由会员分享,可在线阅读,更多相关《中国科技大学课件系列《生物信息学》_1(64页珍藏版)》请在金锄头文库上搜索。
1、生物信息学第三章序列比对R为什么要序列比对?口寻找进化过程中的同源序列;口基于同源物鉴定的功能预测;口基本假设:通常序列的保守性一一功能的保守性口注意:1.蛎白质一航在三级结构的层面上执行功能:*2.蛋白质序列的保守性决定于其编码DNA的保守性;本章内容提要口第一节:数学基础:概率及概率模型口第二节:双序列比对算法的介绍又Dotmatrix动态规划算法*(Needleman-Wunsch,Smith-Waterman算法)么FASTA切BLAST算法口第三节:打分矩阵及其含义口第四节:多序列比对T第一节序列比对的数学基础量盅日排列组合口从N个物品v只=N(N-Dx.x(NV-K+D)=h取出k
2、个物品的排列数:N!(N一万1口从N个物品人-迷-ipe取出k个物品的组合数:lN一一!一3概率模型口概率模型:一个能够通过不同的概率产生不同结果的模型。概率模型可以模拟或者仿真某一类型的所有事件,并且对每个事件赋予一个概率。口色子模型,一个色子存在6个概率值:pypa.,Pe,其中,掷出酌概率力侧广tz,6)。因此:一】障0目)4人江广考虑三次连续的掷色子,结果为1,6,3,则总概率为:p1pepy一3概率分布口考虑连续变量x,例如:物体的重量。则当重量确切为1公斤时的概率,为0。口变量的区间:P(xusxsx)当区间无限小-0时,上式:丿P(x-Ex2Sesx+EM/2)=xXI5K)称为概率密度函数因此:P(Xo三xSX_)=_f(x)dx且I二/(x)#X=l,E(x)=UHP(x)=-,匕二O山2.Ee=2.71828.