遗传统计学知识1

上传人:kms****20 文档编号:51717293 上传时间:2018-08-16 格式:PPT 页数:46 大小:744.50KB
返回 下载 相关 举报
遗传统计学知识1_第1页
第1页 / 共46页
遗传统计学知识1_第2页
第2页 / 共46页
遗传统计学知识1_第3页
第3页 / 共46页
遗传统计学知识1_第4页
第4页 / 共46页
遗传统计学知识1_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《遗传统计学知识1》由会员分享,可在线阅读,更多相关《遗传统计学知识1(46页珍藏版)》请在金锄头文库上搜索。

1、第一章: 群体遗传学的基本概念与原理 2008基本内容基因频率与基因型频率 1Handy-Weiberg平衡定律 2亲属对基因型联合分布 3常染色体位点连锁相不平衡 4影响群体结构的因素(迁移,突变,选择) 5一、基因频率与基因型频率v1、群体的遗传结构 孟德尔群体(Mendelian population): 一个 孟德尔群体,是一群能够相互繁殖的个 体,它们享有一个共同的基因库。在有 性繁殖的生物中,一个物种就是一个最 大的孟德尔群体。一、基因频率与基因型频率v2、 等位基因频率(alleles frequency):在一个二倍体的某特定基因座上某 一等位基因占该座位上等位基因总数的 比率

2、为该等位基因的频率。这是群体遗 传结构的一个最基本的测度(p,q)。一、基因频率与基因型频率v3、基因型频率(genotype frequency):群体中某特定基因型个体的数目,占 个体总数目的比率。D, H, R一、基因频率与基因型频率v4、基因频率计算P(AA)=D; P(Aa)=H;P(aa)=R;p=P(A)=P(A|AA)P(AA)+P(A|Aa)P(Aa)+P(A|aa)P(aa)=D+(1/2)Hp=D+(1/2)Hq=R+(1/2)H一、基因频率与基因型频率v5、基因频率计算例1(记数法): Greenland血型数据(据569个体) :M 83.5%, MN 15.6%,

3、N 0.9%.计算基因频率解:定义M、MN和N的频率为D、H和R;等位基因M、N的频率为p和q。我们有p = D + 1/2H = 0.835+0.5X0.156 = 0.913q = R + 1/2H = 0.09 + 0.5X0.156 = 0.087注意:如果是频数资料,则:p = (2D + H) /2N;q = (2R + H)/2N 。二、Hardy-Weinburg定律v1、基本概念随机交配(Panmixia):在有性生殖生物中,一种性别的任何一个个 体有同样的机会和相反性别的个体交配的方式称 随机交配(random mating)。即各种类型的个体交配的频率完全取决于自 身频率

4、的大小,而不受任何其他因素的影响。实 行随机交配的结果是所有的基因型都是孟德尔式 分离所产生的配子随机结合而形成的。二、Hardy-Weinburg定律v2、Hardy-Weinburg定律在随机交配下的孟德尔群体中,若没有其他因素(基因 突变、选择、迁移)的干扰,基因频率世代相传不变。无论群体的起始成分如何,经过一个世代的随机交配之 后,群体的基因型频率的平衡建立在下列的H-W公式之中 :(pA+qa)2=p2(AA)+2pq(Aa)+q2(aa), 平衡群体的基因型 频率决定于它的基因频率。只要随机交配系统得以保持,基因型频率保持上述平衡 状态不会改变。二、Hardy-Weinburg定律

5、v(1)P(AA)=p2; P(Aa)=2pq;P(aa)=q2(2)只要随机交配系统得以保持,基因型频率保持上述平衡状态不会改变,子代频率仍为:P(AA)=p2; P(Aa)=2pq;P(aa)=q2二、Hardy-Weinburg定律3、Hardy-Weinburg定律证明二、Hardy-Weinburg定律v4、Hardy-Weinburg平衡检验二、Hardy-Weinburg定律v5、Hardy-Weinburg平衡检验例三、亲属对基因型联合分布 v1、基本概念亲属(relative):有血缘关系的人,有血缘关系意 味着基因来源相同,即有相同的祖宗。遗传学中的血缘关系是相对的,一般指

6、三代以内 的亲属关系,一对夫妻如果不是近亲结婚则不是 亲属。而父子、兄弟、祖孙则称之为亲属对(relative pair)三、亲属对基因型联合分布v 2、父子对与兄弟对(同父女、母女等;并假定满足随机婚配与哈代-温伯格平衡定律;二等位基因A,a频率分别为p ,q;符号:父亲F,儿子S,母亲M)父子总和 AAAaaa AAp3p2q0p2 Aap2qpqpq22pq Aa0pq2q 3pq2 总和p22pqpq21三、亲属对基因型联合分布父子总和 AAAaaa AAp3p2q0p2 Aap2qpqpq22pq Aa0pq2q 3pq2 总和p22pqpq21FMP( FM ,S=AA) AAAA

7、 AAAaP4 p3qP( F=AA,S=AA)= P( F=AA,M=AA,S=AA)+ P( F=AA,M=Aa,S=AA)= P4+ p3q=p3推导:三、亲属对基因型联合分布v 3、兄弟对兄弟总和AAAaaaAA(1/4)p2(1+p2) (1/2) p2q (1+p)(1/4) p2q2p2Aa(1/2) p2q (1+p)pq(1+pq) (1/2)pq2(1+q)2pqAa(1/4) p2q2(1/2)pq2(1+q)(1/4)q2(1+q2)pq2总和p22pqpq21推导同理,需要考虑父母的六种婚配型四、常染色体位点连锁相不平衡v1、基本概念 (1)连锁:如果在同一条染色体上

8、的两个基因座相 邻比较近,那么同源于父亲(母亲)的等位基因更倾 向于一起传递给后代,这种现象叫连锁(2)交叉:在交换时一对染色体出现的交叉型结构 。在有丝分裂的双线期可以在显微镜下看到。 (3)互换(crossover):(4)重组(recombination) :奇数次互换导致一个重组交叉之后开始互换4AaBb1 23AaBbccCC1 234AAaaB BbbccCC1 234AAaaB BbbccCC1 234AAaaBBbbccCC四、常染色体位点连锁相不平衡注:交换发生是随机的,距离越长交换的机会越多, 因此交换值的大小可以用来表示基因间的距离长 短。由于交换并不一定导致重组,因此重

9、组值要小于 或等于交换值。 由于无法直接测定交换率,只有通过标记基因的 重组来估计交换的频率。(5)重组率(recombination fraction):用来表示两个基因座之间发生奇数次交换的概率重组率=重组/(重组+非重组) 四、常染色体位点连锁相不平衡重组率取值范围0,1/2四、常染色体位点连锁相不平衡(6)连锁分析(linkage analysis):考察两个基 因座的位置是否临近,通过对一些基因数据的分 析来寻找一些感兴趣的基因位置,也称为基因作 图(genetic mapping)。两个连锁的基因座上的 等位基因更易于作为一个单位由父母传递给后代 ,即更易于共分离。四、常染色体位点

10、连锁相不平衡(7)连锁平衡(linkage equilibrium) :两个基因座的等位 基因组合的频率等于组成组合的等位基因各自频率的积 ,不存在优势组合,称为连锁平衡. (8)连锁不平衡(linkage disequilibrium;LD):两个 位点的某两个等位基因不是独立出现的,则称这两个位点 处于连锁不平衡状态。注:连锁只与两个位点有关,而连锁不平衡是与两个位点上 的等位基因有关。四、常染色体位点连锁相不平衡(9)连锁不平衡计算中的几个量: 连锁不平衡参数: 四、常染色体位点连锁相不平衡若一个群体初始状态D0,假定重组率为,则第 二代D2=(1- )Dn代: Dn=(1- )nD当重

11、组率比较小的时候趋于零的速度比较慢 当重组率比较大的时候趋于零的速度比较快 该公式为关联分析的理论基础四、常染色体位点连锁相不平衡关联分析原理:假设一个疾病基因位点有两个等位基因D,d; 引起疾病的等位基因位D,于是疾病群体中的D的 频率要高于对照群体的, 但是我们不知道该疾病 位点的位置,如果在疾病位点附近的某个标记位 点为A,a,如果D与A 关联,因此连锁不平衡, 即疾病群体中的A的频率要高于对照群体的,即 疾病与A关联。因此我们寻找疾病于对照中差异 较大的标记位点,在标记位点附近可能存在着疾 病基因。四、常染色体位点连锁相不平衡四、常染色体位点连锁相不平衡四、常染色体位点连锁相不平衡注:

12、连锁与连锁不平衡的区别:连锁描述两个位点的位置关系,可通过重组 率来度量,需要重组的数据,因此需要家系资料 。连锁不平衡描述的是群体中两个位点上的等 位基因的关联性,需要群体数据。五、影响群体结构的因素v当一个群体是大的,随机交配,不受进化力量的 影响时,群体的基因频率并不因为遗传而改变。 然而对很多群体而言并不是理想群体。在这种情 况下,基因频率会发生改变。 v 影响群体平衡的主要因素包括:突变、选择、迁 移、遗传漂变和交配系统(非随机交配)。五、影响群体结构的因素v1、突变:突变是一切新遗传变异的来源,等位基 因的新组合可以通过重组而产生,但新的等位基 因只有当突变发生时才能产生。突变提供

13、了进化 作用的遗传原料。大部分的突变将受到损伤,并 从群体中被排除。然而少数的突变可能对个体是 有利的,会被保留下来,并在群体中传播开。突 变有害还是有利取决于特殊的环境,若环境改变 了,先前有害的突变可以变成有利的突变。 v例如在使用杀虫剂DDT之后,昆虫产生了对DDT 的抗性突变,这样昆虫在喷有DDT的环境中不仅 可以生存还能繁殖。五、影响群体结构的因素v突变对进化还有一种潜在的作用:通过突变改变群 体中等位基因频率。例如:一个群体中某个位点包含等位基因A,a, 当A突变为a时,将会降低A的频率,若持续代数 过多将会使得A消失。 五、影响群体结构的因素v突变分为正向、回复突变: 相对概念

14、A突变为a称为正向突变(forward mutation)。 部分基因也会发生反向突变,即a突变A,这些突变 称为回复突变(reverse mutation)。 在一般情况下正向突变的频率要大于回复突变的频 率。五、影响群体结构的因素v2、遗传漂变哈代-温伯格定律的一个主要的假定就是群体无限 大。实际的群体不可能无限大,但它们要大到足 以能预期基因频率和基因型频率。但有些群体很 小,这些群体的几率因子可使基因频率产生随机 变化。由于样本的机误(chance errors)导致群 体基因频率的随机改变称为遗传漂变(genetic drift)或简称为漂变。此是由群体遗传学家S. Wright于1

15、930年提出的,有时人们也把漂变称S. Wright效应。五、影响群体结构的因素v 例:。设想在南太平洋群岛上住着人类的最小群体,假设 只有10个人组成,5个人绿眼睛,5个人棕色眼,假设眼睛 的颜色是由单基因决定的(实际上眼睛的颜色是由多基因 控制的),且绿色眼的等位基因b对棕色眼的等位基因B是 隐性的(BB和Bb为棕色眼,bb为绿色眼)。此岛上的群 体中绿眼等位基因的频率是0.6。一次台风袭击了这个岛 ,群体中50%的人死亡了,也就是5位居民死于风暴。正 巧这死去的5个人是棕色眼。台风之后这个岛上绿色基因 的频率是1.0。在这个群岛上的群体中所发生的突变是绿 眼基因的频率从0.6变成了1.0

16、,这完全是机会所造成。五、影响群体结构的因素v几率使实际结果和预期比产生偏差的这种现象被 称为取样误差(sampling error)。设群体产生一个无穷大的配子库,其含有的等位 基因比分别为p和q。若发生随机交配,所有的配 子都结合成合子,那么基因型的比将是:p2,2pq 和q2,而在合子中等位基因的频率仍保持为p和q 。也许后代的数目是有限的,但这些与配子结合 形成的后代构成了潜在的无限大配子库中的一个 样本。由于随机性,或由于样本的机误,样本可 能偏离大库,样本越小,偏差越大。五、影响群体结构的因素v所有的遗传漂变都是由于取样误差而产生的,但 在自然群体中取样误差的发生有各种途经。几种漂变的发生:在大西洋南部有三个很小的火山岛(Tristan da cwnha),1817年开始由苏格兰人William Glass和 他的家族到岛上居住。后来又迁来几个失事的水 手和几个来自远处岛上的妇女,但这个岛是保持 着遗传隔离的状态。1961年岛上火山爆发,岛上 的群体几乎有300个居住者组成的群体到英格兰 。他们在英国呆了2年,遗传学家研究

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号