新一代位点特异性基因组工程学利器—— TALEN、ZFN 以及CRISPR/Cas2014-05- 来源:lifeomics 作者:闵力 章程 2361 0收藏(18)前言转录激活样效应因子核酸酶(transcription activator-like effector nuclease, TALEN)技术与锌指核酸酶(Zinc-finger nuclease, ZFN)技术组成了一大类强有力的基因组编辑工具,这一大类技术的发展重新划定了生物学研究的边界这些嵌合核酸酶由两部分组成——一个可编码的序列特异性 DNA 结合模块与一个非特异性的 DNA 切割结构域通过诱导DNA 双链断裂(DNA double-strand break)来刺激容易出错的非同源末端连接或在特定基因所在的位置进行的同源定向修复,TALEN 和 ZFN 能够完成一系列遗传学编辑修饰操作成簇规律间隔短回文重复(clustered regulatoryinterspaced short palindromic repeat, CRISPR)技术是最新出现的一种基因组编辑工具,它能够完成 RNA 导向的 DNA 识别及编辑。
与其它基因组编辑工具相比,CRISPR 技术更易于操作,具有更强的可扩展性本文将以上述三种技术为例,介绍并探讨新一代位点特异性基因组工程技术的生物学原理、未来发展趋势,及其在遗传学研究领域的作用和潜在的医学应用前景一、TALEN 技术TAL 效应因子(TAL effector, TALE)最初是在一种名为黄单胞菌(Xanthomonas sp.)的植物病原体中作为一种细菌感染植物的侵袭策略而被发现的这些 TALE 通过细菌 III 类分泌系统(bacterial type III secretion system)被注入植物细胞中,通过靶定效应因子特异性的基因启动子来调节转录,来促进细菌的集落形成由于 TALE 具有序列特异性结合能力,研究者通过将 FokI 核酸酶与一段人造 TALE 连接起来,形成了一类具有特异性基因组编辑功能的强大工具,即 TALEN近年来, TALEN 已广泛应用于酵母、动植物细胞等细胞水平基因组改造,以及拟南芥、果蝇、斑马鱼及小鼠等各类模式研究系统2011 年《自然·方法》(Nature Methods)将其列为年度技术,而 2012 年的《科学》(Science)则将 TALEN 技术列入了年度十大科技突破,针对该文的评论更是给予它基因组的巡航导弹技术的美誉。
1. TALEN 结构及技术原理1.1 TALEN 的典型结构如前文所述,典型的 TALEN 由一个包含核定位信号(Nuclear localization signal, NLS)的 N 端结构域、一个包含可识别特定 DNA 序列的典型串联 TALE 重复序列的中央结构域,以及一个具有 FokI 核酸内切酶功能的 C 端结构域组成不同类型的 TALEN 元件识别的特异性 DNA 序列长度有很大区别一般来说,天然的 TALEN 元件识别的特异性 DNA 序列长度一般为 17-18bp;而人工 TALEN 元件识别的特异性 DNA 序列长度则一般为 14-20bp图 1 TALEN 的结构A)与靶点 DNA(灰色显示,PDB ID:3UGM)结合的 TALE 蛋白每一个独立的 TALE 重复序列元件包含 33 到 35 个氨基酸残基,这些 TALE 重复序列元件能够通过两个高变异度的残基(即重复可变双残基,RVD,棍状显示)来识别一个单一的碱基对 B)TALE 核酸酶(TALEN)形成二聚体结合 DNA 的动画演示TALEN 目标位点由两个 TALE 结合位点组成,这两个位点间通过不同长度的间隔区序列(12-20bp)分开。
TALE 可以被设计成仅仅识别左半侧位点或右半侧位点图片来源:Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405.1.2 TALEN 技术的原理与步骤TALEN 技术的原理并不复杂,即通过 DNA 识别模块将 TALEN 元件靶向特异性的 DNA位点并结合,然后在 FokI 核酸酶的作用 下完成特定位点的剪切,并借助于细胞内固有 的同源定向修复(HDR)或非同源末端连接 途径(NHEJ)修复过程完成特定序列的插入 (或倒置)、删失及基因融合(图 2)图 2 TALEN 进行基因组编辑的原理利用位点特异性核酸酶可以进行基因组编辑,而核酸酶诱导的 DNA双链断裂(DSB)可由同源定向修复( HDR)或非同源末端连接途径(NHEJ )来修复A)在供体质粒(donor plasmid)暴露出延长的同源臂(homology arm)的情况下, HDR 可能导致插入的单个或多个转基因发生改变或取代原有的基因。
B)在缺失供体质粒的情况下,NHEJ 介导的修复会产生小的插入或删失突变,并可能导致目标基因被破坏;在有双链寡核苷酸或线状供体质粒存在的情况下,这些DNA 片段可能通过 NHEJ 介导的连接反应插入;同时诱导两个 DSB 的产生则会引起删失、插入和易位突变图片来源:Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405.TALEN 技术的核心原理就是在同一个蛋白(TALEN)上有序地实现引导进入细胞核、靶位点 DNA 的特异性识别和靶位点 DNA 的切割这三个不同的功能,这一点在上述 TALEN典型结构一节中已作了较为详细的描述在具体操作中,例如在实验室条件下,实现TALEN 的关键就在于完成 DNA 的特异性识别功能,一般说来分为两个步骤图 3 与图 4分别以“铂金门”TALEN 构建系统(Platinum Gate TALEN construction system)和商业化的 easyT 体系为例,展示了实验操作中 TALEN 元件的构建。
图 3 “铂金门”TALEN 构建系统 TALEN 元件构建操作示意图步骤一,四个或更少的组件被连接到阵列质粒(array plasmid)上;步骤二,构建好的阵列随后被连接到哺乳动物表达载体中;白色和粉色的长方形分别表示在 BsaI 和 Esp3I 限制性内切酶切割后留下的粘性末端;蓝色字母代表 RVD,红色字母代表 non-RVD 变化,黄色长方形代表后一半重复图片来源:Tetsushi Sakuma, Hiroshi Ochiai, Takehito Kaneko, Tomoji Mashimo, Daisuke Tokumasu, et al. (2014) Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity. Science Report, 3(3379): 1-8.图 4 “easyT”TALEN 构建系统 TALEN 元件构建操作示意图A)包含一个长度为 18.5 个组件的 TALE 重复元件的 TALEN 体系示意图该 TALE 重复元件由 20 个单体单位(monomer unit)组装而成。
单体单位的边界在组装过程中发生了移位B)TALEN 克隆示意图第一步,由四个单体通过连接反应组装成 4 聚体;第二步,4 聚体(4-mers)进行 PCR 扩增,琼脂糖凝胶电泳,胶回收并浓缩;最后,在第二次连接反应中,4 聚体被组装到 TALEN 骨架质粒(backbone plasmid)上;黄色和蓝色箭头分别表示 4 聚体扩增时的正向引物与反向引物图片来源:Tomonori Katsuyama, Arslan Akmammedov, Makiko Seimiya, Samuel C. Hess, Cem Sievers and Renato Par. (2013) An efficient strategy for TALEN-mediated genome engineering in Drosophila. Nucleic Acids Research, 41(17): e163-171.1.2.1 构建 TAL 靶点识别模块TAL 的 DNA 特异性识别单位是间隔 32 个恒定氨基酸残基的二联氨基酸二联氨基酸与AGCT 这 4 个核苷酸碱基有一一对应的关系:腺嘌呤(A)由 NI 识别、胸腺嘧啶(T)由NG 识别、鸟嘌呤(G)由 NN 识别,而胞嘧啶(C )则由 HD 识别。
实验操作中,我们通过 靶位点的 DNA 序列可以反推能特异性识别这一序列的二联氨基酸序列,从而构建 TAL靶点识别模块1.2.2 TAL 靶点识别模块的克隆与表达根据之前对 TALEN 结构的介绍,我们需要将上一步骤中根据目标 DNA 序列构建好的一对TAL 靶点识别模块与 N 端的核定位序列、C 端的 FokI 酶连接起来,才能得到一个完整的TALEN 元件一般来说,我们可以采用专门用于构建 TALEN 的真核表达载体体系,将一对特异性的 TAL 靶点识别模块克隆进该载体中,再通过转染等方式导入细胞内这种体系一般由供体质粒(donor plasmid,提供单基、二联及三联等类型的 TAL 模块)和骨架质粒(backbone plasmid,用于构建 TALEN 并表达构建好的 TALEN)两类质粒构成,常用的 TALEN 体系有 RCIscript-GoldyTALEN 和 pC-GoldyTALEN、TAL5-BB 和 pTAL6-BB及 pCS2TAL3-DD 和 pCS2TALE-RR 等2. TALEN 技术的应用及近期发展虽然 TALEN 技术的基本原理并不难理解,但其发现过程却较为曲折。
从 1989 年首次发现 TAL 起,研究者前后历时近 21 年才研究清楚 TAL 的工作原理自 2010 年正式发明 TALEN 技术以来,全球范围内多个研究小组利用体外培养细胞、酵母、拟南芥、水稻、果蝇及斑马鱼等多个动植物体系验证了 TALEN 的特异性切割活性2.1 TALEN 技术的应用2011 年北京大学(Peking University)的 Zhang 等人首次使用 TALEN 技术在斑马鱼中成功实现了定向突变和基因编辑;而爱荷华州立大学(Iowa State University)的 Wang 等人则在 2012 年,也以斑马鱼为模式动物,并首次使用 TALEN 技术在活体内完成了特定 DNA 的删除、人工 DNA 插入等较为复杂的操作随后 TALEN 技术在植物、大小鼠的基因组改造等方面的应用也顺利完成而 2013 年 Zhang 使用 TALEN 诱导了 DNA 双链断裂,提高同源定向修复效率,在斑马鱼中实现了同源重组基因打靶2.2 TALEN 的近期发展如前所述,经典的 TALEN 体系已经广泛应用,越来越多的实验室以及实验外包公司均能很好地完成 TALEN 相关实验,但是基本限于单基因的插入或敲除操作,而且主要用于单个基因功能的研究。
2013 年,首尔国立大学化学系和国家基因工程创新举措研究中心的Kim 课题组建立了一个全基因组规模( genome-scale collection)的 TALEN 体系,他。