新一代高通量测序技术SOLiD简介

上传人:夏** 文档编号:505345020 上传时间:2024-02-02 格式:DOCX 页数:3 大小:13.56KB
返回 下载 相关 举报
新一代高通量测序技术SOLiD简介_第1页
第1页 / 共3页
新一代高通量测序技术SOLiD简介_第2页
第2页 / 共3页
新一代高通量测序技术SOLiD简介_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《新一代高通量测序技术SOLiD简介》由会员分享,可在线阅读,更多相关《新一代高通量测序技术SOLiD简介(3页珍藏版)》请在金锄头文库上搜索。

1、新一代高通量测序技术SOLiD简介目前市场上有四种高通量测序仪,分别是Solexa, 454 (GS-FLX), SOLiD和Polonator。根据测 序原理,它们可以被分为两大类:使用合成法测序(Sequencing by Synthesis)的Solexa和454,及 使用连接法测序(Sequencing by Ligation)的Polonator和SOLiD。这些高通量测序仪的共同点是不 需要大肠杆菌系统进行DNA模板扩增,且测序所得序列较短:其中的454序列最长,为200 300个碱基,其余三种序列都只有几十个碱基。测序原理及序列长度的差异决定了各种高通量测 序仪具有不同的应用领域

2、。这就要求我们在熟悉各种高通量测序仪内在技术特点的基础上进行选 择。基因组所引进的 SOLiD (Sequencing by Oligonucleotide Ligation and Detection)是 ABI ( Applied Biosystems )公司生产的高通量测序仪。目前这台SOLiD运行稳定,SOLiD实验及数据分析小 组也可以为大家提供专业的技术服务。所以接下来的关键是如何把SOLiD测序仪应用到符合其 技术特点的科研项目中。本短文将简单介绍SOLiD测序流程,双碱基编码原理及数据分析原理, 以帮助大家了解SOLiD测序仪的技术特点和应用范围。1.SOLiD关键技术及其原理

3、SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析 比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上, 同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。1.1. SOLiD文库构建使用SOLiD测序时,可根据实际 需要,制备片段文库(fragment library)或末端配对文库 (mate-paired library)。简单地说,制备片段文库就是在短DNA片段(60110 bp )两端加上SOLiD 接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、

4、Ecop15I酶切等步骤截取长 DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。 两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长 为 120 180 bp。1.2:油包水PCR我们知道,文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。 和普通PCR 一样,油包水PCR也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及 可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1 磁珠球形表面(SOLiD

5、将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁 珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引 导合成的DNA链也就被固定到P1磁珠表面了。油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术 是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转 的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR 反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物 和磁珠表面的P1引物所介导的PCR反应

6、,这个DNA模板的拷贝数量呈指数级增加,PCR反应 结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物ABI公司提供的SOLiD 实验手册已经把小水滴体积及水相中DNA模板和磁珠的个数比等重要参数进行了技术优化和流 程固定,尽可能提高“优质小水滴”(水滴中只含一个DNA模板一个P1磁珠)的数量,为后续SOLiD 测序提供只含有一种DNA模板扩增产物的高质量P1磁珠。1.3. 含DNA模板P1磁珠的固定SOLiD测序反应在SOLiD玻片表面进行。含有DNA模板的P1磁珠共价结合在SOLiD玻片 表面。磁珠是SOLiD测序的最小单元。每个磁珠SOLiD测序后形成一条序列(具体SOL

7、iD测序 过程请见图5)。1.4. SOLiD双碱基编码原理及测序流程SOLiD“双碱基编码原理”实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关 系。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互 补规则与单链DNA模板链配对。如图1“底物探针”所示,探针5末端可分别标记“CY5 ,Texas Red, CY3, 6-FAMTM”4种颜色的荧光染料,并且这四种颜色用数字“3, 2, 1, 0”示意;探针3端1 5位为随机碱基,可以是“A, T, C, G”四种碱基中的任何一种碱基,其中第1、2位构成的碱基 对是表征探针染料类型的编码区,“双碱基编

8、码矩阵”规定了该编码区16种碱基对和4种探针颜 色的对应关系,而35位的“n”表示随机碱基,68位的“z”指的是可以和任何碱基配对的特殊 碱基,由上可知,SOLiD连接反应底物中共有45种底物探针。单向SOLiD测序包括五轮测序反应。每轮测序反应含有多次连接反应(一般情况下,片段文 库是7次,mate-paired文库是5次,所以片段文库共有35个连接反应,而末端配对文库共有25 次连接反应)。每轮测序反应的第一次连接反应由与P1引物区域互补的“连接引物”介导。这五种 连接引物长度相同,但在P1引物区域的位置相差一个碱基(分别用n, n-1, n-2, n-3, n-4表示), 都含有5端磷酸

9、,所以可以介导连接反应的进行。现以图5所示一个磁珠上发生的SOLiD测序 反应为例进行说明。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均 质单链DNA模板(也就是每个磁珠表面的单链DNA模板序列都是一样的),所以这次连接反应掺 入一种8碱基荧光探针,SOLiD测序仪记录反应模板序列第1、2位碱基序列的探针第1、2位 编码区颜色信息,随后的化学处理断裂探针3端第5、6位碱基间的化学键,并除去68位碱基 及5末端荧光基团,暴露探针第5位碱基5磷酸,为下一次连接反应作准备。由此我们知道第 一次连接反应使合成链多了 5个碱基,所以第二次连接反应得到反应模板序列第6、7位碱基序

10、列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息.以此类推, 第一轮测序反应获取了模板链7个碱基对的颜色信息。如图5所示,由于第二轮连接引物n-1比 第一轮错开一位,所以第二轮得到是以0, 1位起始的7个碱基对的颜色信息。五轮测序反应反 应后,按照第0、1位,第1、2位.的顺序把对应于模板序列的颜色信息连起来,就得到由“0, 1, 2, 3”组成的SOLiD原始颜色序列。1.5. 数据分析原理SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列(图6.a)。理论上来说,按照 “双碱基编码矩阵”(图4),只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SO

11、LiD 原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的兼并特性(一种 颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色 编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基(图6.1)。和所有其它测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。为避免“连 锁解码错误”的发生,SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是 依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把 reference碱基序列转换成颜色编码序列,然后与SOLiD原始颜

12、色序列进行比较,来获得SOLiD 原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和 SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”(图6)。 由于每个碱基都被独立地检测两次(图5),且SNP位点将改变连续的两个颜色编码(图6.2),所以 一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测 序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综 合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。2.SOLiD测序技术的应用

13、2.1. 基因组测序全基因组重测序。研究者可以基因组 DNA为初始样本构建SOLiD文库(fragment文库及 mate-paired文库),以恰当的全基因组序列为reference,可以快速鉴定SNP,indel及基因组结构 变化。特定基因组区域测序。除应用于传统的ChIP-seq,SOLiD技术平台还可以结合芯片技术,富 集特定基因组序列进行深度测序,快速鉴定SNP。其关键技术流程如下:SOLiD fragment文库 经适当循环数PCR扩增得到足量样品DNA(约30ug),文库扩增产物与Agilent芯片(或其它自订 制芯片)杂交,然后对芯片探针紧密结合的洗脱产物进行常规 Emulsi

14、on PCR及SOLiD测序。 SOLiD结合芯片技术对基因组特定区域的进行深度测序,可发现低频率SNP (如肿瘤样本中特 定基因的体细胞突变)。2.2. RNA-seq高通量测序仪的问世,使得测序成本大大降低,提供了不依赖现有基因模型的大规模基因表 达谱研究手段,促进了针对细胞全部转录产物(small RNA等non-coding RNA,低拷贝 protein-coding RNA及其可变剪接体)的深度挖掘及后续功能研究。目前有两种SOLiD试剂盒促进SOLiD测序仪在转录组上的应用。SOLiD small RNA试剂盒 以含5段磷酸及3段羟基的small RNA为初始样本,2天就可完成与

15、SOLiD RNA特异adapter 连接,逆转录,PCR 扩增等步骤,得到 SOLiD fragment 文库。SOLiD whole transcriptome expression 试剂盒针对序列较长的non-coding RNA或mRNA。该试剂盒使用RNA H将mRNA或去除rRNA 的总RNA片段化并回收酶切产物,其后实验流程和SOLiD small RNA完全相同。这两种试剂盒 以RNA为初始样本,并且所用的RNA特异adapter方向确定,所以最后测序所得序列的方向也 就确定了。而传统方法大多以双链cDNA为初始样本,难以确定测序所得序列来自转录本的正 义链还是反义链而干扰后续

16、数据分析。同时,SOLiD强大的测序能力,使得高通量发掘低拷贝 转录本成为可能。3. 基因组所SOLiD测序仪运行情况目前,ABI公司针对我所SOLiD实验小组的技术培训基本结束。SOLiD实验小组已经具备独 立构建基因组片段文库和末端配对文库的能力,所构建文库各项质量指标基本符合要求。作为 ABI 高级客户,我们获得了 SOLiD small RNA 和 SOLiD whole transcriptome expression 试剂盒各 一个。相关转录组学实验正在进行中。4. 小结现在看来,SOLiD技术可对具有reference基因组序列的物种进行重测序,鉴定SNP, indel 及基因组结构变化;对含有全基因组序列且转录本注释较好的物种开展转录组学研究,解析细胞 转录产物的数量变化及其结构信息。但SOLiD测序所得序列的长度只有几十个碱基,数据分析 过程依赖reference序列,目前尚没有基于SOLiD原始颜色序列的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号