lecture16遗传统计1228zuo

上传人:桔**** 文档编号:571602418 上传时间:2024-08-11 格式:PPT 页数:65 大小:1.47MB
返回 下载 相关 举报
lecture16遗传统计1228zuo_第1页
第1页 / 共65页
lecture16遗传统计1228zuo_第2页
第2页 / 共65页
lecture16遗传统计1228zuo_第3页
第3页 / 共65页
lecture16遗传统计1228zuo_第4页
第4页 / 共65页
lecture16遗传统计1228zuo_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《lecture16遗传统计1228zuo》由会员分享,可在线阅读,更多相关《lecture16遗传统计1228zuo(65页珍藏版)》请在金锄头文库上搜索。

1、2024/8/11遗传数据基因定位的统计方法简介1遗传数据基因定位的统计方法简介遗传数据基因定位的统计方法简介左晓宇左晓宇生物医学研究的统计方法生物医学研究的统计方法生物医学研究的统计方法生物医学研究的统计方法2024/8/11遗传数据基因定位的统计方法简介2背背 景景分子遗传学的最新发展给人类复杂性状复杂性状的遗传研究提供了机遇。很多人类疾病,如胰岛素依赖性糖尿病、高血压以及精神分裂症都认为有遗传成分,确定可能影响此类疾病的基因位置对病因研究极为重要。基因定位的任务基因定位的任务:参照某些已明确位置的遗传标遗传标记记来推测某种表型的易感基因在染色体上的位置。2024/8/11遗传数据基因定位

2、的统计方法简介3复杂性状疾病的特点:复杂性状疾病的特点:1.多基因参与2.单一基因作用微弱3.遗传模式尚未确定4.群体遗传异质性强5.外显率低6.受一组环境因素的作用7.多个生物过程共同参与致病机制2024/8/11遗传数据基因定位的统计方法简介4关注的目标关注的目标人类疾病基因组学研究主要关注的目标:人类疾病基因组学研究主要关注的目标:对那些表型与基因型间并不存在严格一一对应关系的、更为广泛的复杂遗传学机制的揭示。遗传学、遗传学、基因组基因组学学易感基因易感基因定位定位基因基因-表型遗表型遗传机制剖析传机制剖析基因基因-基因与基因与基因基因-环境相环境相互作用探讨互作用探讨基因转录和基因转录

3、和调控关系阐调控关系阐明明2024/8/11遗传数据基因定位的统计方法简介5主要方法:主要方法:基因定位的主要理论策略、方法:基因定位的主要理论策略、方法:1.基于连锁(连锁(linkage)的分析方法2.基于关联(关联(association)或连锁不平衡(连锁不平衡(linkage disequilibrium,LD)的分析方法 2024/8/11遗传数据基因定位的统计方法简介6一、基本概念一、基本概念l基因(基因(gene)和和位点(位点(locus)l决定某一性状的DNA功能单位称为基因基因,它是一段具有特定结构的连续的DNA序列。(估计人类核基因有近十万个)l每个基因在染色体上都有特

4、定的位置,即基因座(locus),又称为位点位点2024/8/11遗传数据基因定位的统计方法简介7多态性(多态性(polymorphism)l基因的不同形式,如A和a,相互为等位基因等位基因(alleles)l等位基因的组合称为基因型基因型(genotype)l具有相同等位基因的个体称为纯合子纯合子(homozygote):如 aa、AAl具有不同等位基因的个体称为杂合子杂合子(heterozygote):如 Aal等位基因的不同形式即为多态性现象多态性现象2024/8/11遗传数据基因定位的统计方法简介8复等位现象复等位现象一个基因存在很多等位形式,称为复等位现象复等位现象(multiple

5、 allelism)。例如,人的血型ABO血型。ABO血型由3个复等位基因决定。这3个复等位基因是IA;IB;i,它们组成6种基因型基因型。但因IA与IB间表示共显性,而IA和IB对i都是显性,所以6种基因型只显现4种表型表型(phenotype)。2024/8/11遗传数据基因定位的统计方法简介9IAIA 和 IAi 在表型上相同,都是A型型IBIB 和 IBi 在表型上相同,都是B型型IAIB 杂合体中,IA 和 IB 都是显性,表型是AB型型ii 的表型是O型型u表型(表型(phenotype):):表型是指可观察到的个体性状,如身高,体重,血型,是否患有某种疾病等。2024/8/11遗

6、传数据基因定位的统计方法简介10基因频率、基因型频率基因频率、基因型频率l等位基因的基因频率:等位基因的基因频率:一个群体中某一等位基因在其位点上可能出现的比率或百分率。例如:P(A)=0.3l基因型频率:基因型频率:在某个群体中携带不同基因型的个体所占的比率。例如:P(Aa)=0.32024/8/11遗传数据基因定位的统计方法简介11遗传标记遗传标记l遗传标记(遗传标记(genetic marker)l在基因定位中,以多态性位点为“标记”或“路标”,用一定的方法将疾病基因确定到染色体的实际位置2024/8/11遗传数据基因定位的统计方法简介12第一代:第一代:包括限制性片段长度多态性(RFL

7、P)、可变串联重复序列(VNTR)。第二代(微卫星标记):第二代(微卫星标记):微卫星(MS)是指DNA基因组中小于10个核苷酸的简单重复序列,又称短串联重复(STR)。第三代(单核苷酸多态性,第三代(单核苷酸多态性,SNP):):主要是指基因组水平上单个核苷酸的变异引起的多态性,其意义已超出了遗传作图的范围,成为研究基因多样性和识别、定位疾病相关基因的一种新型手段。2024/8/11遗传数据基因定位的统计方法简介132024/8/11遗传数据基因定位的统计方法简介14l单体型单体型/单倍型(单倍型(haplotype) 一条染色体上的两个或者两个以上的多态位点组合。上图是两个位点组合后的可能

8、的基因型(单体型对)A1B1/A2B2 与 A1B2/A2B1 。单体型对也形成这两个位点组合后的基因型。2024/8/11遗传数据基因定位的统计方法简介15随机婚配随机婚配随机婚配:随机婚配:任何一个女性同任何一个男性婚配的机会相同,此时婚配类型的概率就是婚配的女性基因型频率和男性基因型频率的乘积,如在随机婚配的前提下,一个群体的下一代的基因和基因型频率会与其上一代保持相同,我们称这个群体处于平衡状态平衡状态。设一个位点有两种可能的等位基因A和a,且某个群体中这两种等位基因的基因频率基因频率分别为如果这个群体在某一代中这一对等位基因的三种基因型的频率基因型的频率为我们称这个群体处于平衡状态平

9、衡状态。2024/8/11遗传数据基因定位的统计方法简介17Hardy-Weinberg (H-W)平衡定律平衡定律l在一个较大的、随机交配的、处于平衡状态的群体中,在无迁移、无选择、无突变的情况下,群体中各种基因(型)频率将保持世代平衡,具有恒定性,这就是Hardy-Weinberg (H-W)平衡定律)平衡定律l在遗传分析中,常常假设Hardy-Weinberg(H-W)平衡l假设的有效性可以用 检验来考察。2024/8/11遗传数据基因定位的统计方法简介18H-W平衡检验平衡检验 H0:群体处于H-W平衡 H1:群体不处于H-W平衡 =0.05 O - (observed frequen

10、cy ) 实际观测的基因型频数 E - (expected frequency) 理论基因型频数对于有两种可能等位基因的座位,在H-W平衡状态下,样本含量为n的随机样本中,不同基因型的期望数目为基因型:期望频数:2024/8/11遗传数据基因定位的统计方法简介19例例23-1:一项高血压遗传研究中,对在某个群体中随机抽取197名个体进行血管紧张素转化酶基因位点的基因型分型,数据如下: AA Aa aa 26 93 78欲检验该群体是否处于H-W平衡。2024/8/11遗传数据基因定位的统计方法简介202024/8/11遗传数据基因定位的统计方法简介21检验方法方法H0:群体处于H-W平衡;H1

11、:群体不处于H-W平衡;=0.052024/8/11遗传数据基因定位的统计方法简介22遗传模式(遗传模式(hereditary mode)设疾病位点的等位基因D,d。D为致病等位基因,d为正常等位基因。记人群中D、d的频率分别为:记基因型DD,Dd,dd 的外显率(外显率(penetrance),),即条件患病率 P(affected|genotype) 为fDD, fDd, fdd。2024/8/11遗传数据基因定位的统计方法简介23在疾病位点处于Hardy-Weinberg平衡下,人群中的患病率:2024/8/11遗传数据基因定位的统计方法简介24四种遗传模式:四种遗传模式:1.显性遗传模

12、式(dominant)2.隐性遗传模式(recessive)3.加性遗传模式(additive)4.乘积遗传模式(multiplicative)2024/8/11遗传数据基因定位的统计方法简介25二、连锁分析二、连锁分析连锁连锁(linkage):如果两个位点位于同一条染色体上且距离非常近,父亲或母亲同一条染色体上的这两个位点的等位基因就会倾向于一起传递给子女一起传递给子女,这种现象称为连锁。最可能的生物解释:最可能的生物解释:这两个位点的物理位置很近,故作为一个共同的单位传到子代。2024/8/11遗传数据基因定位的统计方法简介26重组重组(recombination): 家系的亲代在向子代

13、的传递过程中发生交换,致使原先处于同一条染色体上的基因彼此分离。两位点物理距离越近近,发生重组现象的可能性越低低,连锁现象越明显明显重组现象重组现象2024/8/11遗传数据基因定位的统计方法简介27bACaCAcac形成配子形成配子bBBbACac同源染色体同源染色体BbACacacAC交叉(交叉(crossing over)bBBBACacacAC复制复制姐妹染色单体姐妹染色单体bbB2024/8/11遗传数据基因定位的统计方法简介28重组体和非重组体示意图重组体和非重组体示意图重组体:重组体:某一个体由遗传所得单倍体型与他的父亲或母亲自其(外)祖父或(外)祖母遗传所得的单倍型不同。非重组

14、体:非重组体:某一个体遗传所得的单倍型与其双亲之一由遗传所得的单倍型相同。图1:重组体和非重组体示意图111111221211221112024/8/11遗传数据基因定位的统计方法简介29重组率重组率两个位点发生重组的频率称为这两个位点的重组率,用 表示。由“自由组合”定律可知,若两个基因位于不同染色体上,重组率为0.5; 而两个连锁位点,重组率 。遗传上将1%的重组率定为1个遗传学单位个遗传学单位,即1个厘摩(centiMorgan, cM)2024/8/11遗传数据基因定位的统计方法简介30连锁分析连锁分析是根据染色体上不同等位基因的重组率来计算两对(或两对以上)基因之间的染色体图距,从而

15、确定各个位点间的距离关系。连锁分析方法连锁分析方法一般是以有关遗传标记为“路标”,以被定位基因与其连锁路标的重组率为“遗传学距离”,进行基因定位。2024/8/11遗传数据基因定位的统计方法简介31连锁分析的两种方法:连锁分析的两种方法:1.基于遗传模式的连锁分析-参数连锁分析方法2.不基于遗传模式的连锁分析-非参数连锁分析方法2024/8/11遗传数据基因定位的统计方法简介32由于连锁导致的共分离现象只有在家系内部才能观察到,所以,检测连锁必须要有家系调查家系调查资料。2024/8/11遗传数据基因定位的统计方法简介332.1 Lods 连锁分析连锁分析Lods连锁分析法:连锁分析法:log

16、 odds score法,即对数优势记分法这是基于遗传模式(model-based)的连锁分析方法,应已知1.要研究性状的遗传模式;2.性状控制位点的等位基因数目;3.每种基因型的外显率。2024/8/11遗传数据基因定位的统计方法简介34Lods是指两个位点按某一重组率 连锁时,产生所观察到的家庭的概率与不存在连锁情况下 产生该家庭的概率之比的对数,即计算不同下的Z值,对应最大Z值的即为所求的重组率。2024/8/11遗传数据基因定位的统计方法简介35一般地,当 Z 3 时,可以认为存在连锁,相当于P0.001,表示连锁发生的可能性为不发生的1000倍倍。 连锁重组率 值的意义为:紧密连锁松

17、弛连锁中度连锁2024/8/11遗传数据基因定位的统计方法简介36例例题:假定控制某种疾病的位点位于常染色体上,遗传模式为显性,疾病位点上有两个等位基因D和d,引起疾病的等位基因D在人群中很少。同时假定一个标记位点有两个等位基因M和m。2024/8/11遗传数据基因定位的统计方法简介37例:研究者通过调查得到一个家庭的数据(如下图所示)。此家庭数据包含三方面的信息。家庭成员的患病状态每一成员的标记基因型成员之间的亲缘关系。家庭成员的疾病位点的基因型是不能通过实验手段得到的,因为未知疾病位点的位置。问题:疾病位点是否与标记位点连锁?祖父祖母父亲母亲女儿1女儿2儿子1女儿3儿子2Mmmmmmmmm

18、mMmMmMmMm假定:P(有病|DD)= P(有病|Dd)=1, P(有病|dd)=0.MmmmmmmmmmMmMmMmMm2024/8/11遗传数据基因定位的统计方法简介40结论:由于Z值小于3,故该家庭数据不足以支持疾病位点与标记位点连锁的假设。2024/8/11遗传数据基因定位的统计方法简介41例题:例题:例例23-2:Machado-Joseph病(MJD)是一种常染色体显性遗传的脊髓小脑共济失调。为了缩短MJD致病基因在第14号染色体上的定位范围,王国相等(1997年)采用第14号染色体上13个新近发现的微卫星DNA多态标记位点对4个中国MJD家系进行了连锁定位分析。这4个多代中国

19、MJD 家系共有成员61名,其中包括患者15名。(图表见生物医学研究的统计方法P462,图23-3)2024/8/11遗传数据基因定位的统计方法简介43参数连锁分析小结参数连锁分析小结生物学基础:生物学基础:重组现象与连锁现象资料要求:资料要求:家系数据(家系越全面,功效越高)目的:目的:估计重组率,区域定位疾病位点方法:方法: Lods连锁分析(似然比检验)前提条件:前提条件:需已知疾病位点的遗传模式、等位基因数目、外显率2024/8/11遗传数据基因定位的统计方法简介442024/8/11遗传数据基因定位的统计方法简介45问题:问题: 疾病位点与标记位点无连锁,或 =0.5 疾病位点与标记

20、位点连锁,或 = Aaaa,影响程度分别设为2、1、02024/8/11遗传数据基因定位的统计方法简介62组别组别基因型基因型合计合计AAAaaa病例n11n12n13n1对照n21n22n23n2合计m1m2m3N影响程度210趋势检验统计量为服从自由度为1的2分布2024/8/11遗传数据基因定位的统计方法简介63组别组别基因型基因型合计合计AAAaaa病例n11n12n13n1对照n21n22n23n2合计m1m2m3N影响程度2102024/8/11遗传数据基因定位的统计方法简介64小结小结p基本概念pHardy-Weinberg平衡p连锁分析:Lods连锁分析p关联分析:群体关联分析基因型关联分析和等位基因关联分析连锁与连锁不平衡2024/8/11遗传数据基因定位的统计方法简介65THE ENDTHANK YOU!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号