《家蚕第12连锁群EST-SSR的信息分析》由会员分享,可在线阅读,更多相关《家蚕第12连锁群EST-SSR的信息分析(18页珍藏版)》请在金锄头文库上搜索。
1、2 微卫星标记技术及其在蚕学研究中的应用前景2.1微卫星DNA 的定义与结构微卫星DNA ,也称为简单序列( simple sequence)DNA、简单序列重复(simple sequence repeat ,SSR)DNA或简单串联重复(simple tandem repeat ,STR)DNA。微卫星DNA 在结构上由重复不同次数的核心模体(core motif) 组成,根据核心模体的不同长度,将微卫星DNA 与其它被称为小卫星(minisatellite)DNA 和卫星( satellite) DNA 的重复DNA 区别开来。小卫星DNA 有更长的核心重复单元,常在十几个碱基到几百个碱
2、基之间。微卫星DNA 的核心结构是由16个核苷酸为重复单位串联组成的长达几十个核苷酸的序列24 。按照重复结构的不同可将微卫星DNA分为3 种类型25 :完全重复型(perfect repeats) ,重复单元之间没有被打断,如(CA) n ;不完全重复型(imperfect repeats) , 重复单元之间被打断, 如(CA)nCCA(CA)m;复合型(compound repeats) ,邻近的串联重复序列不同,如(CA) n (TG)m。普遍认为双核苷酸微卫星重复单元类型对杂合度没有影响,但重复次数却很重要。双核苷酸微卫星的多态信息含量(polymorphism informative
3、 content ,PIC) 在0 ( n 或n + m 10) 到10 ( n 或n + m 24) 之间26 。作为有用的遗传标记只有超过16 个双核苷酸重复单元的微卫星会有可靠的高PIC ,但是一些在1016 个重复单元之间的微卫星也可能有用27 。三核苷酸重复比双核苷酸少10 倍左右,最常见的形式是(AAB) n (B = C ,G或T) 。四核苷酸更少,最常见的形式是(AAAB) n (B = C ,G或T) 。三核苷酸与四核苷酸微卫星DNA 的PIC 的高低与重复单元的序列有很大关联,AT 丰富的重复和多态性相对高一些28 。微卫星DNA 的两侧是相对保守和专一的单拷贝序列。利用侧
4、翼序列设计引物可以特异性扩增微卫星位点,使微卫星DNA 以PCR 的形式从基因组中被选择性地扩增出来。这就是微卫星标记(microsatellite marker) 。2.2微卫星标记2.2.1微卫星标记的主要特征2.2.1.1 SSR 标记具有高度的多态性微卫星DNA本身重复单位数的变异是形成微卫星多态性的基础。对微卫星变异的机制有多种假设,比较一致的观点是微卫星的重复序列在复制过程中容易滑动错配而产生不同长度的重复序列。这种多态性常常表现为复等位性,在不同的基因型间广泛存在。重复次数的多少与该位点等位基因数呈正相关。遗传标记物如果具有高度选择性,就不再具有广泛的标记作用,因为它只能代表其自
5、身;如果选择性太低,则多态性低,起不到标记的作用。微卫星核心结构的突变频率约10 - 210 - 6/ 代位点,这样的突变率使微卫星呈现高多态性,而又具有一定的稳定性30 。2.2.1.2 SSR 标记在真核生物基因组中数量多且分布均匀微卫星DNA 存在于所有已检测过的真核生物的基因组中,并在整个基因组中都有分布,其均一性比其它标记高,并且是唯一的一个分布在着丝粒(centromeres) 区域附近的多态性标记。在哺乳动物中几乎每个基因都存在至少1 个微卫星标记31 。2.2.1.3 SSR 标记遵循孟德尔式遗传规律和共显性遗传模式多位点的指纹图谱和RAPD 通常仅可被解释为显性标记,杂合子看
6、起来就象纯合子,不能看到父源染色体与母源染色体上等位基因的差异。用显性标记来估计表现型参数更困难。而微卫星标记是共显性标记,并且遵循孟德尔式遗传法则30 ,31 。2.2.1.4 SSR 标记在相关物种中具有保守性和通用性由于用于设计微卫星标记特异性引物的序列是微卫星位点两侧的侧翼序列,该序列在相关物种中是高度保守的,这使微卫星标记也具有相同的保守性。目前许多物种的微卫星标记来源之一就是相关物种微卫星标记的直接应用32 ,33 。2.2.1.5 SSR 标记可利用PCR 检测SSR 标记是一个PCR 标记,需要的样品量非常少。行为学家用SSR 标记调查个体非常小的有机体交配关系;保护遗传学家用
7、SSR 标记对濒危物种进行非损伤取样研究。SSR 标记扩增序列短,最多500 bp 左右,可以用于已经降解DNA 如古生物的研究34 。微卫星标记引物是特异性引物,重复性强,稳定性好,所得的数据可以在不同实验室之间交流和比较。2.2.1.6 SSR 标记可以进行高度自动化分析SSR 标记是特异性PCR 标记,在基因组中只有1 个扩增位点,扩增片段长度也在200500 bp ,通过聚丙烯酰胺凝胶电泳分离扩增片段检测,十分适合高度自动化分析。随着技术的发展,越来越多的研究利用荧光标记微卫星进行多重PCR ,通过DNA 测序仪和自动探测器进行电泳及数据分析35 。2.2.1.7 微卫星标记可作为序列
8、示踪位点( sequence tagged site ,STS) 微卫星标记与其它的分子标记如RAPD、VNTR、RFLP、AFLP、ISSR 不同,它得到的引物可以直接用于基因组的特异性扩增,理论上每个样品的PCR 产物电泳只产生1 条带或2 条同样深度的带(在实际应用中要复杂些) ,可直接作为STS ,这一特点将拓宽其应用前景。2.3 SSR 标记获得的途径 获得SSR 标记主要有3 条途径:一是从公共序列数据库(如EMBL ,GenBank 各EST 数据库) 中寻找已存在的SSR 标记;二是使用与所研究物种亲缘关系较近物种的SSR 标记;三是用经典分子生物学方法克隆所需要的微卫星位点,
9、建立DNA文库(如基因组文库、富集文库(enriched library) 、BAC/ YAC 库,cDNA 文库) ,用重复数目为1020 的(CA) n 或其它SSR 寡核苷酸探针通过杂交法从文库中筛选出来,再经DNA测序,由微卫星DNA 的侧翼序列设计引物,获得SSR标记36 。大量的SSR 标记需通过建库、测序的第3种方法获得。当一个新的微卫星标记发现后,需进行多态性分析及杂合度测定。通过对某物种几十个不同品系的PCR 扩增,根据聚丙烯酰胺凝胶电泳分离的扩增产物片段大小来鉴定该微卫星标记的多态性情况,最后还需通过与已知微卫星位点的连锁分析来确定其在染色体上的位置。2.4SSR 标记数据
10、的统计分析法2.4.1 SSR 标记多态水平的评估方法分子标记多态性描述的术语有两个:第一是杂合度(heterozygosity) ,表示研究群体中任意位点的两个等位基因彼此不同的可能性,计算公式: , Pi 为等位基因基因频率;第二个是多态信息含量(polymorphism informative content) 简称PIC ,其考虑了杂合父母在同样杂合的后代的连锁分析时不能提供信息的事实,在家系分析中能更好的反映标记的值。Botstein 推导的公式如下 ,Pi 和Pj 为等位基因基因频率。一个可能有用的信息标记的杂合度大于60 %,或者PIC 值大于0.60。对SSR标记而言,还有一个
11、重要的参数,即等位基因的频率。等位基因的频率是计算基因型分布频率的基础。根据Hardy2Weinberg 原理,由于每一个体任何常染色体位点的等位基因均呈二项分布,假定该个体某一位点基因型为M、N ,等位基因频率为p 和q ,并且( p + q) = 1 ,其基因型分布可按( p + q) 2 来计算,即( p+ q) 2 = p2 + 2 pq + q2 。假定人群中某一位点有3 种类型的等位基因,其频率为p、q 和r ,则该位点基因型分布为( p + q + r) 2 。以此类推,可计算出任何已知基因型和等位基因数目的基因频率。2.4.2 遗传距离(genetic distance) 为了
12、能够更全面地反映亲本品种间的遗传差异,需要对多个性状综合考虑,从而引伸出遗传距离的概念。按多元统计分析方法计算品种间多个性状基因型值构成的多维空间的几何距离,就叫做品种间的遗传距离。在SSR 标记中常用到Nei 氏标准遗传距离和绝对距离38 。Nei 氏相关系数Sij = 2Nij/ ( Ni + Nj) ;Nei 氏遗传距离GDij= 1 - Sij 。Nij是指材料I 和J 之间共同的等位基因数目; ( Ni + Nj) 是两个材料所有的等位基因数目。因为SSR 标记是用的测序胶分离片段的,等位基因的大小可以直接用其碱基数来表示,因而可以用绝对距离(absolute distance) 来
13、计算遗传距离: 和akj分别是第I 和第J 个品种在第K个位点的重复序列大小(碱基数) ,L 是所分析的位点总数。计算Nei 氏遗传距离的软件可采用Genepop Version 3. 4 ,June 2003 ,能反映微卫星标记的杂合子或纯合子状况;计算绝对距离的软件可以采用Microsat v. 1. 5 (E.Minch ,Stanford University ,U. S.A) 。2.4.3 系统发生树(phylogenetic trees) SSR 标记常用的构建系统树的方法有两种。应用最广泛的是平均连接聚类法(average linkage clustering) 或称UPGMA法
14、(应用算术平均数的非加权成组配对法,unweighted pair2proup method using an arithmetic average) 。该法将类间距离定义为两个类的成员所有成对距离的平均值。Nei 等39 模拟了构建树的不同方法,发现当沿树上所有分枝的突变率相同时,UPGMA 法一般能够得到较好的结果,但必须强调有关突变率相等(或几乎相等) 。另一些模型研究证实当各分枝的突变率不相等时,这一方法的结果不尽人意。当各分枝突变率相等时,认为分子钟(molecular clock) 在起作用。比较经典的是由Saitou 和Nei 提出的邻接法(Neighbor joining Me
15、thod) 40 。该方法以Nei 氏标准遗传距离为参数,通过确定距离最近(或相邻) 的成对分类单位来使系统树的总距离达到最小,通过循序地将相邻点合并成新的点,就可以建立一个相应的拓朴树。其中相邻树枝间的亲疏关系可通过bootsrrapping 数位的大小显示。2.5辅助育种通过一些与性状连锁的微卫星标记,可以在生命早期对该性状进行选择,也可以在两种性状中同时选择。这样,世代间隔缩短,选择强度提高,将大大简化育种工作。1999 年Reddy 等58做了家蚕基因组SSR 标记的相关研究,分离出28 个微卫星位点,其中用13 个家蚕的品系对15 个SSR 标记进行了多态性分析。家蚕分子标记的研究还
16、有RFLP(restriction fragment length polymorphisms) 30 ,59 ,Bkm 探针60 ,M13 探针62 。Reddy 等44 在家蚕基因组SSR 标记的研究中,从插入片段为018 kb ,基因组覆盖率为0.153 %的家蚕不完全基因组文库中用传统的杂交法得到(GT) n和(CT) n 的阳性克隆,估计家蚕基因组中平均每49kb 出现1 个(GT) n ,每104 kb 出现1 个(CT) n ,总共约有10 000 个(GT) n 和5 000 个(CT) n 。(GT) n 重复序列的丰富度与其它物种类似,而(CT) n 重复序列与大黄蜂和蜜蜂相比却少得多。从中分离出28 个微卫星位点,其中的15 个SSR 标记用13 个家蚕的品系进一步分析SSR 标记的多态性水平。等位基数的范围在31