单核苷酸多肽及等位频率

上传人:枫** 文档编号:553794483 上传时间:2023-01-13 格式:DOCX 页数:4 大小:69.83KB
返回 下载 相关 举报
单核苷酸多肽及等位频率_第1页
第1页 / 共4页
单核苷酸多肽及等位频率_第2页
第2页 / 共4页
单核苷酸多肽及等位频率_第3页
第3页 / 共4页
单核苷酸多肽及等位频率_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《单核苷酸多肽及等位频率》由会员分享,可在线阅读,更多相关《单核苷酸多肽及等位频率(4页珍藏版)》请在金锄头文库上搜索。

1、-单核苷酸多态及等位频率摘要:群体遗传学是研究生物群体的遗传结构和遗传结构变化规律的科学,应用数学和 统计学的原理和方法研究生物群体中基因频率和基因型频率的变化,以及影响这些变化的 环境选择效应、遗传突变作用、迁移及遗传漂变等因素与遗传结构的关系,由此来探讨生 物进化的机制并为育种工作提供理论基础。而利用大分子序列特别是DNA序列变异来进行群体遗传学研究后,人们可以从数量上 精确地推知群体的进化演变, 并可检验以往关于长期进化或遗传系统稳定性推论的可靠程 度。同时,对生物群体中同源大分子序列变异式样的研究也使人们开始重新审视达尔文的 以“自然选择”为核心的生物进化学说。20世纪60年代末、70

2、年代初,Kimura、King和 Jukes相继提岀了中性突变的随机漂变学说:认为多数大分子的进化变异是选择性中性突变 随机固定的结果。群体指的是孟德尔群体,即一群相互繁育的个体。一个最大的孟德尔群体是一个物种。 一个群体中全部个体所共有的全部基因称为基因库。群体中各种基因的频率,以及由不同 的交配体制所带来的各种基因型在数量上的分布称为群体的遗传结构。获知了不同世代中 遗传结构的演变方式就可探讨生物的进化过程并据以培育各种新的生物品系和品种。可是 群体遗传学并不等同于进化遗传学。后者探讨的是物种内变异转化为物种间变异的过程, 即物种的形成和绝灭,而前者则仅仅涉及品系间、品种间和亚种间等的变迁

3、。如果就群体遗传学作历史性地考查,可以认为它是由生物统计学方法结合达尔文的自 然选择与孟德尔遗传定律而形成的。群体遗传学的核心是以群体中的突变基因的动态,作为概率过程来进行理论处理的。群体遗传学起源于英国数学家哈迪和德国医学家温伯格于1908年提出的遗传平衡定律 基本内容:1、遗传物质染色体的基本概况2、单核苷酸多态3、单核苷酸多态的测定及数据格式4、基因频率与基因型频率5、全基因组范围内分析SNP应注意的问题 一、染色体的基本概况1、人类基因组的构成人类基因组包含23对染色体,其中22对常染色体(按照染色体长短编码1-22),一 对性染色体(男性为X+Y;女性为X+X)。同源染色体的一条来自

4、于父亲,另一条来自于母 亲。2、同源染色体与 DNA 双链同源染色体(homologous chromosomes):是指在二倍体生物细胞中,形态、结构基 本相同的染色体,并在减数第一次分裂的四分体时期中彼此联会,最后分开到不同的生殖 细胞(即精子、卵细胞)的一对染色体,在这一对染色体中一个来自母方,另一个来自父 方。DNA 双链:一对同源染色体共包含两条染色体,每一条都是由两条链构成的,每一条 链都是由四种碱基排列而成,两条链之间碱基互补配对。这四种碱基为:腺嘌吟(A)、鸟嘌 吟(G)、胞嘧啶(C)和胸腺嘧啶(T)。其中配对规则是A与T配对、G与C配对,也称之为碱基 对( base pair

5、)。3、同源染色体数据的抽象表述我们通常用A、G、C、T的组合来抽象的表述染色体的碱基排列。由于DNA是双螺旋 结构,因此一对同源染色体共包含四条链,即两对互补配对的DNA链。对于其中的一对互 补链,只要我们知道一条链的序列碱基排列,就可以依据互补原则确定另一条链的碱基排 列。因此对于一对互补链来说,我们只要检测一条链的序列信息即可。这样,一对同源染 色体(原本四条序列)就可以用两条序列来表述。以后,我们将用两条由 A、 G、 C、 T 组 合而成的序列代表一对同源染色体。4、物理位置:是将染色体短臂端在上,长臂端在下放置,至上而下计算碱基对的个数,第 一个碱基对处为1bp,第二个碱基处为2b

6、p,依次类推。(注:此时假定一对同源染色体 等长)。每个位置也成为一个位点。单位换算: 1kb=1000bp;1mb=1000kb。二、单核苷酸多态(多为2态SNP)突变率低,一次突变,自然选择使得等位扩增单核昔酸多态性(single nucleotide polymorphism,SNP)主要是指在基因组水平上由单个核昔酸的变异所引起的DNA序列多态性。它是人 类可遗传的变异中最常见的一种。为了加深理解,可以理解为:突变是一次性历史事件,自然选择使得突变碱基在群体扩张。 另外,为了描述方便,我们通过一个示例来进行阐述。例:假定某个人群中有N个个体、某位点原有的碱基为G,则初始状态中任何个体在

7、该 位点处均为纯合子G/G,如果该位点发生了一次突变(假设核辐射引起),使得部分个体的G 突变为A,则突变个体具有的基因型状态为G/A或者A/A,如果A能够使得个体更适应外部环 境(也就是说含有A的个体更容易生存),则A将会在群体中扩张,含有A的个体所占的比例 会越来越多。1、SNP 等位(Allele)从上例中,我们可以看出包含该位点的染色单体共2N条(因为同源染色体,所以乘以 2),这2N个染色单体一共有两种碱基类型G和A,每个碱基类型成为一个等位(Allele)。野生型:上例中,G为群体初始状态具有的等位,称为野生型。突变型:上例中,A为突变后新产生的等位,称为突变型。SNP基因型(ge

8、notype)对于群体中的每个个体,一对同源染色体中的每条在该位点处的取值为G或A。因此, 每个个体的同源染色体在该位点处的相型为G/G(野生型纯合)或G/A (杂合)或A/A (突变型 纯合)。2、SNP基因型:同源染色体在同一位点的两个等位组成的相型。大多数的单核苷酸多态都是二态的SNP等位的数学抽象:通常用A、a或1、2表示两个等位。SNP基因型的数学抽象:通常用AA, Aa, aa,或0,1,2来表示三个基因型。SNP的数学编码在后面的分析中会经常用到。注: 理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上, 后两者非常少见,几乎可以忽略。 占所有已知多态性

9、的 90%以上。 SNP数目:人类基因组中SNP的数目还是个未知数,据估计人类所有群体中存在大约 3000万个SNP位点(平均约每300 600 bp )存在一个碱基突变。 SNP以其分布广、易于分型、检查速度快和频率易于估计的特性,作为第三代遗传标记 已被广泛的应用。3、非同义SNP与同义SNP从对生物的遗传性状的影响上来看,SNP又可分为2种:同义SNP(synonymous SNP):即SNP所致的编码序列的改变并不影响其所翻译的蛋白 质的氨基酸序列,突变碱基与未突变碱基的含义相同。非同义SNP(non-synonymous SNP):指碱基序列的改变可使以其为蓝本翻译的蛋白质 序列发生

10、改变,从而影响了蛋白质的功能。4、非多态 SNP (Nonpolymorphic SNP)在理解SNP的概念需要注意的一个问题是,SNP是一个群体上的定义。对于多个群体而 言,同一个SNP位点在所有的个体中存在两种等位,但在单独的某一个群体中只存在一个等位, 此时我们称这个SNP为这个群体中的非多态SNP。5、dbSNP中SNP数据的格式:rs2476601 Homo sapiensAACCACAATA2ATGATTCAGGTGTCC A/G TACAGGAAGTGGAGGGGGGATTTCA |三、单核苷酸多态的测定及数据格式1、传统检测方法拝本A (ITT)样本B(TM)样本C(AA)GG

11、TAOC-gwc一 pur产尙KpnlSH 切KpnlMWlGG/.RCC.GOT蘇雷戟爵戯电放.T并;然后个条假定,某个 将序列切断, 片段通过琼丿 144-1=( Z亠 士i=iICR产物大小: ,经过酶切后 信息,条带信:427bp,Kpnl 限制性内切酶识别 产物是 246bp+171bp 两个片段。 分为 3类:1个条带、 2个条带和 3(1) 如果个体是T/T纯合子,同源染色体PCR产物相同,都含有T,都被酶切断,共形成 246bp 长度和 171bp 长度的段,经过扩增后开始电泳,由于长度不同、质量不同导致运动速度 不同(短的速度快,长度速度慢),经过一段时间后会形成两个条带。(

12、2) 如果个体是T/A杂合子,同源染色体PCR产物为不同的两个,其中含有T的被酶切断, 形成246bp长度和171bp长度的段,而含有A的则没有被酶切,长度仍然是427bp,最后的 片段共三个长度:246bp、171bp和427bp。经过扩增后开始电泳,经过一段时间后会形成三 个条带。(3) 如果个体是A/A杂合子,同源染色体PCR产物相同,都含有A,而含有A的没有被酶切 断,长度仍然是427bp,最后的片段共一个,长度:427bp。经过扩增后开始电泳,经过一段 时间后会形成一个条带。2、SNP芯片gDNA 750ngDAY 2IXIDX xunxijXQBX3(gDNA)* Indicate

13、s stain in red channel *lndicatos stain in gren channel扩增后DNA片断化(gDNA)在芯片上进行单碱基延伸(gDNA) (Identical probes por boad typo)(gDNA)O准备Bead chipO DNA片段上芯片杂交0软件判断分型结果、生成报告新一代测序技术指的是高通量测序技术(High-throughput sequencing)又称“下一代测 序技术(Next-generation sequencing technology),以能一次并行对几十万到几百万条DNA 分子进行序列测定和一般读长较短等为标志。对无参考序列的物种,进行重头测序(de novo sequencing),获得该物种的参考序列, 为后续研究奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并 检测突变位点,发现个体差异的分子基础。新一代测序的一个优点是不用事先已知一些SNP,可以通过多个个体的序列比对从而发 现新的 SNP 位点。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号