连锁交换值的计算ppt课件

上传人:m**** 文档编号:569994828 上传时间:2024-08-01 格式:PPT 页数:46 大小:765KB
返回 下载 相关 举报
连锁交换值的计算ppt课件_第1页
第1页 / 共46页
连锁交换值的计算ppt课件_第2页
第2页 / 共46页
连锁交换值的计算ppt课件_第3页
第3页 / 共46页
连锁交换值的计算ppt课件_第4页
第4页 / 共46页
连锁交换值的计算ppt课件_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《连锁交换值的计算ppt课件》由会员分享,可在线阅读,更多相关《连锁交换值的计算ppt课件(46页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章连锁交换值的计算连锁交换值的计算第一节第一节连锁现象的统计测定连锁现象的统计测定1亲本及其配子遗传构成亲本及其配子遗传构成相引相相引相AB/ab配子:亲本型:配子:亲本型:AB,ab交换型:交换型:Ab,aB相斥相相斥相Ab/aB配子:亲本型:配子:亲本型:Ab,aB交换型:交换型:AB,ab各基因型个体数各基因型个体数双显性:双显性:a=AB;单显性单显性:b=Ab;c=aB;隐隐性性: d=ab2如何判断连锁关系如何判断连锁关系步骤:步骤:先分析每个基因是否符合正常分离先分析每个基因是否符合正常分离然后多对基因再联合分析然后多对基因再联合分析3测测A a与与1 1之间的偏差;之

2、间的偏差;测测B b与与1 1之间的偏差之间的偏差测测新新组组合合;老老组组合合与与1 1之之间间的的偏偏差差,即即测测两两对对基基因的独立性。因的独立性。一、对测交后代进行x2测验a=AB;b=Ab;c=aB;d=ab理论上测交后代,理论上测交后代,A:a=1:1即即a+b=c+d;B:b=1:1即即a+c=b+d如不连锁重组类型与亲本类型如不连锁重组类型与亲本类型1:1即:即:ad=b+c4例例:对对AaBb进进行行测测交交,产产生生612个个后后代代,其其中中AB=220,Ab=84,aB=102,ab=206,A、B基因之间是否存在连锁?基因之间是否存在连锁?把各项数字代入公式:把各项

3、数字代入公式:根据自由度(根据自由度(d.f.),),可以查出获得上述可以查出获得上述 2值的概率值的概率:2值d.f.PAa0.0310.9-0.7Bb1.6710.25-0.1总值95.8230.005Aa-Bb94.1210.0055二、对F2进行2测验6表4-1测验两类性状分离的不同理论比率2值公式2公式11213115197分离比率分离比率r17例一、让例一、让AaBb自交得到自交得到AB=142,Ab=49,aB=43,ab=15,n=249,试问,试问AB之间是否连锁?之间是否连锁?把各项数值代入公式,则:把各项数值代入公式,则:d.f.=1P=0.700.50d.f.=1P=0

4、.900.80d.f.=1P=0.98总总 2=0.3869+0.0656+0.0004=0.4529d.f.=3P=0.990.95可见可见Aa和和Bb各自的分离都符合各自的分离都符合3 1分离比率,分离比率,Aa与与Bb重组类别也符合重组类别也符合9 3 3 1之之比,说明这两对基因间不存在连锁关系。比,说明这两对基因间不存在连锁关系。8例二,让例二,让AaRr自交,后代出现自交,后代出现AR=152,Ar=99,aR=43,ar=9,求,求AR之间是否存在连锁关系?之间是否存在连锁关系?依依9 3 3 1假设,算得各个假设,算得各个 2值和总值和总 2值如下:值如下: A2=9.99d.

5、f.=1P0.01 R2=18.31d.f.=1P0.01 L2=13.66d.f.=1P0.01总总 2=41.96d.f.=3P 0.01从总从总 2来看,这个结果不符合来看,这个结果不符合9 3 3 1的分离的分离比率,但从各比率,但从各 2的分解值来看,出现这种偏差的分解值来看,出现这种偏差主要在于基因对的遗传行为不正常,因而扰乱主要在于基因对的遗传行为不正常,因而扰乱了整个分离群体的比例。了整个分离群体的比例。9例三、例三、PpSs自交,后代表现型为自交,后代表现型为PS=235,Ps=91,pS=109,ps=9,求,求PS间是否存在连锁关系。间是否存在连锁关系。算得各算得各 2值

6、及值及P值为:值为: P2=0.590d.f.=1P=0.500.30 S2=1.453d.f.=1P=0.300.20 L2=20.184d.f.=1P0.01总总 2=22.227d.f.=3PP0.75,说明符合独立遗传,说明符合独立遗传,Aa和和Bb并不连锁。并不连锁。14五、卡方测验的正确应用五、卡方测验的正确应用1、卡方值与样本容量、卡方值与样本容量实际观察值与期望值保持不变时,样本实际观察值与期望值保持不变时,样本容量大,则卡方变小。容量大,则卡方变小。所以,百分数不能用于卡方测验所以,百分数不能用于卡方测验2、连续矫正、连续矫正15表4-2卡平方值,偏差和样本容量原始样本原始样

7、本(A)偏差不变偏差不变(B)偏差增至偏差增至n倍倍(C)偏差随偏差随增加增加样本容量样本容量n200800800800实际观察量实际观察量120420480440按按1 1期望值期望值100400400400偏差偏差202080402值值82328此表说明,百分数不能用于卡方测验此表说明,百分数不能用于卡方测验16这里所讲的一些原理也可以用来指导样本容量的设计:这里所讲的一些原理也可以用来指导样本容量的设计:例如,某大麦遗传学家在例如,某大麦遗传学家在200株大麦幼苗中发现有株大麦幼苗中发现有94株是浅绿苗。株是浅绿苗。而从理论上推算,幼苗应按一半绿苗一半浅绿苗分离。实际观而从理论上推算,幼

8、苗应按一半绿苗一半浅绿苗分离。实际观察值与理论值的偏差为察值与理论值的偏差为6(或相当于期望值的(或相当于期望值的6%)这一偏差的这一偏差的2值仅为值仅为0.72,说明上述分离完全适合,说明上述分离完全适合1 1的比例。然而,的比例。然而,该遗传学家怀疑淡绿基因可能与低生活力有关,故决定作另一种实该遗传学家怀疑淡绿基因可能与低生活力有关,故决定作另一种实验。他提的问题是:如果要在更大的样本中仍然保持验。他提的问题是:如果要在更大的样本中仍然保持6%的偏差,的偏差,需要检查多少株才能使需要检查多少株才能使2值增加达值增加达10倍?答案可以从表中找到,即倍?答案可以从表中找到,即实际观察值与期望值

9、之间的偏差如果保持在实际观察值与期望值之间的偏差如果保持在6%的水平上,将样本的水平上,将样本容量扩大到原来的容量扩大到原来的10倍,就会使卡平方值达到要求的倍,就会使卡平方值达到要求的7.2。在这样大。在这样大的样本中若能否定的样本中若能否定1 1的分离比例,则就足以证明浅绿苗的活力较的分离比例,则就足以证明浅绿苗的活力较差。在另一方面,如果大样本的卡平方值证明对差。在另一方面,如果大样本的卡平方值证明对1 1的分离偏差并的分离偏差并不大,则可消除对淡绿苗活力较差的怀疑。不大,则可消除对淡绿苗活力较差的怀疑。17第二节第二节连锁强度(交换值)的计算连锁强度(交换值)的计算一、测交法相引相相引

10、相:P值的标准差S.E.p=相斥相相斥相:18利用测交法计算交换值的优点是:利用测交法计算交换值的优点是:1需要的群体较小;需要的群体较小;2能分别求出不同性别的交换值;能分别求出不同性别的交换值;3用相引和相斥相的平均资料可以平衡成活率差异造成的影响;用相引和相斥相的平均资料可以平衡成活率差异造成的影响;4在三点或多点测验中求出的基因序列比较可靠。在三点或多点测验中求出的基因序列比较可靠。小麦、水稻等自花受粉作物由于人工授粉比较麻烦,测交法难于小麦、水稻等自花受粉作物由于人工授粉比较麻烦,测交法难于应用。有时,双隐性个体或不能成活,或生活力很弱,在开花授粉应用。有时,双隐性个体或不能成活,或

11、生活力很弱,在开花授粉前死亡。在这种情况下,就不得不利用前死亡。在这种情况下,就不得不利用F2资料求算连锁强度。资料求算连锁强度。19当雌雄配子交换值相等且无选择受精时,在当雌雄配子交换值相等且无选择受精时,在相引相相引相,各类配子自由结合的结果,各类配子自由结合的结果,F24类合子理论次数(频次)为:类合子理论次数(频次)为:b(Ab)=aB(c)=a(AB)=3(1-P)2/4+4P(1-P)/4+2P2/4=d(ab)=二、理论配子和合子频率的计算二、理论配子和合子频率的计算20相斥相的理论合子次数为:相斥相的理论合子次数为:21表表4-2不同连锁方式不同连锁方式F1的理论配子次数和的理

12、论配子次数和F2的理论合子次数的理论合子次数配子(及合子)类别代号理论配子次数理论合子次数相引相相斥相相引相相斥相ABaAbbaBcabd总数111122三、利用F2资料计算交换值(一)根据(一)根据F2双隐性个体出现的频率双隐性个体出现的频率双隐性个体的出现是由于双隐性个体的出现是由于ab与与ab配子相结合的结果,在相斥相出现次数为配子相结合的结果,在相斥相出现次数为,即,即aabb=,故,故。在相引相,双隐性个体出现次数在相引相,双隐性个体出现次数,由于,由于此此法法计计算算交交换换值值只只根根据据F24种种类类型型中中出出现现概概率率最最少少的的一一种种类类型型,因因而而常常常常有有较较

13、大的取样误差。大的取样误差。23(二)利用(二)利用F24种类型的全部资料种类型的全部资料1相加法。把a+d与b+c进行比较而计算交换值P值。例如,在相引相:24在相斥相:在相斥相:25现现举举一一实实例例进进行行演演算算:玉玉米米中中有有一一个个株株,自自交交结结果果如如下下(d为为矮矮生生株株,pr为红色糊粉层):为红色糊粉层):F2表表 现现型型代号代号株数株数频率频率+a4230.492+prb2120.247d+c2150.250Dprd100.012总数总数8601.000a+b=0.504b+c=0.497交换值交换值,即,即8.4交换单位。交换单位。26极极大大似似然然率率(m

14、aximumlikelihood)是是连连锁锁估估计计中中最最常常用用的的方方法法。这这一一方方法法对对重重 组组 率率 估估 计计 需需 要要 从从 资资 料料 ( 数数 据据 ) 中中 获获 得得 尽尽 可可 能能 多多 的的 信信 息息 。 最最 大大 化化(maximization)则则通通过过求求算算p的的导导数数令令其其为为零零来来进进行行,即即求求算算的的为为p值值的的最最大大可可能能值值,试试误误差差达达到到最最小小。为为方方便便起起见见,往往往往把把似似然然的的表表达达转转化化为为对对数数形形式式,使使函函数数为为最最大大时时,对对数数值值也也达达最最大大。如如果果令令m1,

15、m2,m3mt分分别别表表示示分分离离类类型型1,2t的的期期望望比比值值,并并令令a1,a2,at为为各各相相应应类类型型的的实实际际个个体体数数。期期望望比比值值m可可以以用用p表表示示。例例如如在在测测交交时时,由由相相引引组组连连锁锁的的双双杂杂合合子子产产生生的的4种种后后代代类类型型的的比值可表示为:比值可表示为:m1=m4=1/2(1-P),m2=m3=1/2P。获获得得实实测测家家系系的的似似然然值值可可由由(m1+m2+mt)n展展开开式式中中的的一一项项求求出出。其其中中n为为家系的总个体数,相应各项为:家系的总个体数,相应各项为:似然率的对数形式为:L=C+a1logm1

16、+a2logm2+atlogmt2、极大似然法、极大似然法27通过求导数并令其为零即可得到估计方程:为了解出P,可直接将a1,a2at的实际观察值和各类型的期望值m1,m2mt代入该式。一般说来,连锁强度的估计可利用测交或F2代资料来进行。1利利用用测测交交资资料料计计算算重重组组率率若把相引组连锁的双杂合子AB/ab与双隐性个体ab/ab杂交,那么,把这些m表达式代入估计方程得:28这这样样估估计计的的p值值就就是是该该测测交交中中的的重重组组率率。与与此此相相似似,在在相相斥斥组组连连锁锁情情况况下下,双双杂杂合合子子中中两基因的重组率两基因的重组率p可用下式估计:可用下式估计:292、对

17、相引组、对相引组F2代资料而言,仍以代资料而言,仍以a, b,c,d代表代表4类个体数类个体数则有:则有:ABAbaBab观察值abcd理论频率30如令K=(1-P)2,则:L= alog(1/2+1/4K)+blog(1/4-1/4K)+clog(1/4-1/4K)+dlog(1/4K)求导:通分得:a(1-K)Kb(2+K)Kc(2+K)K+d(2+K)(1-K)0即nK2-(a-2b-2c-d)K-2d=0,n为F2个体数令Z=a 2b 2c d,则根据一元二次方程求根公式得:交换值:交换值:相斥相连锁得情况下K=P231导数实际上是在X0点切线的斜率32 = 作代换 即得即得 这就是对

18、数函数的导数公式这就是对数函数的导数公式, ,特殊地特殊地, ,当当 时时, ,由上式得自然对数函数的导数公式由上式得自然对数函数的导数公式: : 33如前面例子:相斥相数字计算P值:n=860,Z=4232212221510=44134测交例:测交例:在在番番茄茄上上,基基因因Br代代表表正正常常节节间间,它它们们相相对对于于短短节节间间基基因因br为为显显性性。基基因因S为为可可育育基基因因,对对半半不不育育基基因因s表表现现为为显显性性。用用双双隐隐性性个个体体(brs/brs)对对双双杂杂合合体体(Brs/brS)作作测测交交。测交后代的频数为:测交后代的频数为:BrS-131-n/2

19、PBrs-360-n/2(1-P)brS-390-n/2(1-P)brs-119-n/2P总数总数-1000-n这样,其对数形式的似然函数表达为:这样,其对数形式的似然函数表达为:L=131log(p)+360log(1-p)+390log(1-p)+119log(p)p=250/1000=0.2500或或25%p值的精确度常用其标准误值的精确度常用其标准误Sp来衡量。测交中,估计来衡量。测交中,估计Sp的一般公式为的一般公式为在上例中在上例中于是该测交所测得的重组率及其误差可表达为:于是该测交所测得的重组率及其误差可表达为:p=0.25000.0136935四、以四、以F2数据及测交数据估计

20、重组率的数据及测交数据估计重组率的相对效率比较相对效率比较当一定数量的植株(当一定数量的植株(n)被测定以后,就可以通过比较)被测定以后,就可以通过比较两种交配组合的方差来估计用测交和两种交配组合的方差来估计用测交和F2资料估计重组资料估计重组率率p的相对效率。比如,在某一测交中算得的重组率的相对效率。比如,在某一测交中算得的重组率p=0.20,测定植株数为,测定植株数为400,方差应为,方差应为0.0004。在一个。在一个与之相似组合中,以与之相似组合中,以F2资料算得在相斥组连锁情况下,资料算得在相斥组连锁情况下,重组率重组率p=0.20,n=400,方差约为,方差约为0.0023(在相斥

21、组连(在相斥组连锁情况下锁情况下:36以一定数量的植株数所提供的信息量来衡量的两种组以一定数量的植株数所提供的信息量来衡量的两种组合的相对效率,是与它们方差值的比数成反比的。在合的相对效率,是与它们方差值的比数成反比的。在上例中,上例中,p值为值为0.2,n=400,F2资料相对于测交资料的资料相对于测交资料的效率为:效率为:0.0004/0.0023,或等于,或等于1/6。也就是要获得同。也就是要获得同样的方差值,采用样的方差值,采用F2资料所需的观测植株数应为采用资料所需的观测植株数应为采用测交后代的测交后代的6倍之多。或者说,为了测出倍之多。或者说,为了测出20%的重组率,的重组率,测交

22、中所需的样本量可以减为测交中所需的样本量可以减为F2资料的资料的1/6就可以保持就可以保持相同的精度,用方差比值来度量相对效率对于不同相同的精度,用方差比值来度量相对效率对于不同p值值可能有所不同,但总的来说测交要比可能有所不同,但总的来说测交要比F2更有效(除非更有效(除非p的值很小而且的值很小而且F1处于相引组的连锁)因此在条件可能处于相引组的连锁)因此在条件可能时应尽量采用测交法。时应尽量采用测交法。37补充、似然函数估计补充、似然函数估计在连锁分析中,亲本基因型或基因的连锁相有时并不清楚,因而在连锁分析中,亲本基因型或基因的连锁相有时并不清楚,因而无法简单地通过计算重组体出现的频率来进

23、行连锁分析。那么如无法简单地通过计算重组体出现的频率来进行连锁分析。那么如何判断其连锁关系?在此情况下可以采用似然比方法来检验连锁何判断其连锁关系?在此情况下可以采用似然比方法来检验连锁是否存在,即比较假设两个座位间可能存在连锁(是否存在,即比较假设两个座位间可能存在连锁(r0.5)的概)的概率与可能不连锁(率与可能不连锁(r=0.5)的概率。其概率之比可以用似然比统计)的概率。其概率之比可以用似然比统计量来表示,即量来表示,即L(r)/L(0.5),其中,其中L()为似然函数。为似然函数。为了计算方便,常将为了计算方便,常将L(r)/L(0.5)取以取以10为底的对数,称为为底的对数,称为L

24、OD值。值。为了确定两对基因之间存在连锁,一般要求为了确定两对基因之间存在连锁,一般要求LOD3,即似然比大即似然比大于于1000 1,即连锁的可能性要超过不连锁的可能性,即连锁的可能性要超过不连锁的可能性1000倍,与此倍,与此值相对应的值相对应的2测验的显著水平为测验的显著水平为0.0002;而要否定连锁的存在,;而要否定连锁的存在,则要求似然比小于则要求似然比小于100 1,即,即LOD2。如假定如假定G与与J之间存在如下可能关系:之间存在如下可能关系:380.9log9/5=+0.230.5log9/5=+0.130.1log1/5=0.070.5log1/5=0.35LOD值:+0.

25、160.22上述结果的意义是上述结果的意义是,如要证明两基因连锁,则如要证明两基因连锁,则LOD值达到值达到3时时的个体数为的个体数为:3/0.16=18.75即即19株;株;反之,如要否定二者不连锁则需要的个体数为反之,如要否定二者不连锁则需要的个体数为:3/0.2213.63即即14株。株。392利用利用F2资料估计重组率资料估计重组率在F2家系中,以p表示的不同类型配子的期望值与测交情况是相同的,但因为雄配子与雌配子的重组率可能相同,也可能不相同,所以以p1和p2分别表示雄配子和雌配子中的重组率则可能更为合理。为此,相引组连锁时的配子期望值应分别为:ABAbaBab雄配子雄配子1/2(1

26、-p1)1/2(p1)1/2(p1)1/2(1-p1)雌配子雌配子1/2(1-p2)1/2(p2)1/2(p2)1/2(1-p2)相斥组连锁时各种配子类型的期望值与相引组的写法相似。根据期望的配子比例就可能预期4种表型上不同的合子的比例。因为双隐性合子只能由双隐性的雄配子和双隐性的雌配子结合产生。该类型的比例应为自交时,由于a类个体的总发生率为1/4,所以单隐性类型aB的出现率将为1/41-(1-p1)(1p2)。同样,由于b类个体的总发生率为1/4,故Ab类型个体的出现率为1/41-(1-p1)(1p2)。双显性类型的出现率必然为1/42+(1-p1)(1p2)。40例例1:相引相:相引相在

27、大麦上,已知二棱(V)对六棱(v)为显性,绿苗(Lg)对浅绿苗(lg)为显性。在基因型VVVLgLg与vvlglg的杂种F2中,4种表型的数量及期望数分别为:类型:VLgVlgvLgvlg总和实测数:281596058458期望数:n/4(2+p)n/4(1-p)n/4(1-p)n/4(p)n其中p=(1-p1)(1-p2)。以 对 数 表 达 的 似 然 率 函 数 为 : L = 281log(1/2+1/4p)+59log(1/4-1/4p)+60log(1/4-1/4p)+58log(1/4p)因此458p2+15p-116=0p=0.4871如果能证明p1=p2,那么p=p2=p1=

28、1-=0.3021或30.21%在相引组连锁中p的标准误由下式计算:其中q=1-p。在上例中,Sp=0.0265或2.65%,所以其重组率及标准误可表达为:p=(30.212.65)%41例例2:相斥相:相斥相如如果果F2资资料料来来自自相相斥斥组组的的F1自自交交,其其重重组组率率也也可可用用相相似似的的方方法法估估计计。例例如如,番番茄茄的的基基因因O(圆圆果果)对对基基因因o(长长果果)为为显显性性。基基因因S(单单花花序序)对对s(复复合合花花序序)为为显显性性。由由Os/oSF1值值株株自自交交产产生生的的F2植植株株中中4种类型的实际株数为:种类型的实际株数为:圆果单花序长果单花序

29、圆果复合花序长果复合花序总和实际观察数12666634458期望配子比例1/2p11/2(1-p1)1/2(1-p1)1/2(p1)1/2p21/2(1-p2)1/2(1-p2)1/2(p2)期望表型比例n/4(2+p)n/4(1-p)n/4(1-p)n/4pn其中:p=p1p242取对数表达的似然率函数式为:取对数表达的似然率函数式为:L=126log(1/2+1/4p)+66log(1/4-1/4p)+63log(1/4-1/4p)+4log(1/4p)故故259p2+136p-8=0从中解得从中解得p=0.05339如果假设如果假设p1=p2,则,则或或23.11%。相斥组连锁计算。相斥

30、组连锁计算p的标准误的公式为:的标准误的公式为:在在上上例例中中,Sp = 0.0582或或5.82%,于于是是重重组组率率及及其其标标准准误误可可表表示示为为:p =(23.15.82)%433乘积法乘积法这里先要根据F24类表现型的个体数,求取相应乘积的比值。在相斥相,根据ad/bc的比值,在相引相,根据bc/ad的比值,就可以计算出P值。例如,在相斥相:乘积值:查Fisher表可得P值44相引相的比率公式:相引相的比率公式:P值的标准差公式与极大似然法的公式相同。即:45S.E.P也不需要计算,备表中已经列出折算数值,只须以除之,即可求得。现在仍以的自交后代结果为例,计算P值:查表4-3,P=0.20+,再查相应的标准差折算数为0.6422,以除之得:即d与pr之间的交换值为202.1交换单位,此数与极大似然法算得的结果完全一致。46

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号