《基因组文库构建课堂PPT》由会员分享,可在线阅读,更多相关《基因组文库构建课堂PPT(53页珍藏版)》请在金锄头文库上搜索。
1、第四章 基因组文库的构建基因组文库(genomic library)即基因文库(gene bank)是含有某种生物体全部基因的随机片断的重组DNA克隆群体。构建基因文库时先提纯生物的总DNA,通过机械剪切或酶切使其成为一定大小的片段,连接到适当载体(常为噬菌体)上,经体外包装转染细菌,得到一群含不同DNA片段的重组噬菌体颗粒。此即是基因文库。这群DNA片段含盖基因组全部基因。1 cDNA文库(cDNA library) : 克隆的重组cDNA的总和,通常是在细菌或酵母中。这些克隆代表从某个特定物种或器官的所有mRNA制备得到的cDNA。 cDNA分子克隆(cDNA clone) :将cDNA片
2、段装在载体上转化细菌,扩增出多克隆的过程,最终可建立cDNA文库。2建库的目的:1.从复杂的基因组中分离单拷贝的基因;2.是从来源复杂的总mRNA的cDNA文库中分离稀有的cDNA克隆。建库的关键:如何产生足够数量的重组DNA建库应注意: 1.保证载体DNA和靶DNA均不被外源DNA序列污染; 2.尽可能用“ 电话克隆”。34 第一节 DNA克隆片段的产生与分离一.基因组DNA的片段化 1.用限制酶片段化:用限制酶消化DNA,不经凝胶电泳分部离,直接和载体连接的克隆方法叫鸟枪法(shot-gan approach) 存在的问题: 所形成的重组体分子是一群带有大小不同插入片段的混合群体。以每个载
3、体可插入13kbDNA计算, 基因库至少含1030万个重组质粒。从中筛出目的基因工作量是很大的。 目的基因内部可能有一个以上的酶切位点,即一个基因分载在 几个重组质粒上,完整筛出更不容易。52.随机片段化: 超声波:可产生300bp的短片段。高速搅拌:1500转/分30分 可切 平均长度8kb的分子群体。3.双酶消化单酶消化的产物一般分子较大,选择时要考虑到载体容量,如噬菌体插入片段不超过25kb,为此可选用识别4bp的限制酶(切割平均长度为256bp) ,识别6bp的限制酶切割平均长度4096 bp. 6双酶切产生的DNA片段平均大小不超过1kb,但如采用双酶部分消化,产物的分子量可达103
4、0kb,它们存在着随机序重叠,用蔗糖梯度离心或凝胶电泳可将这些片段群体按大小分开,可得到的分子量大小约为20kb的随机DNA片段群体。二. DNA片断大小的分部 如已知含目的基因克隆片段的大小范围,可在克隆前用蔗糖梯度离心或琼脂糖凝胶电泳将DNA群体按大小分部分离。三.目的基因克隆片段的富集。7 四.克隆数的确定任一DNA序列在文库中出现的概率: N:该序列需要克隆的总数;p:待克隆DNA序列在文库中设定的出现概率,一般为99;I:待克隆DNA片段的长度,假定为17kb;G: 基因组DNA的总长度,如人类为3109bp8将数据代入上式 = 8.1105N的含义是克隆大小为17kb的人类DNA时
5、,所构建的基因文库数必须在 8.1105 以上时,才能以99的概率得到此克隆。9五. cDNA文库一.概况:cDNA文库是通过反转录mRNA,并制备双双链链cDNAcDNA(double stranded cDNA)来构建的。构建cDNA文库的策略是取决于:(1)目的mRNA的相对丰度;(2)筛选方法: 除简单的分子杂交法外还可对表达产物用各种方法进行鉴定。10cDNA文库的优点(1)使遗传物质为RNA病毒可建立文库;(2)因克隆数比基因组文库少得多,易于筛选;(3)从分化特异的细胞的cDNA文库中可分离到特异表达的基因。(4)建库时已排除了其它的RNA,使假阳性率减低。(5) cDNA文库可
6、在细菌中表达,可用多种策略进行筛选。11但应注意:(1) 细胞中不同mRNA的丰度不同,低丰度的mRNA要求很高的克隆数(要用公式来计算)。(2)有的基因表达具有严格的时空性,要获得其mRNA并非易事。用不同发育阶段,或不同组织细胞中的mRNA制备的cDNA文库会包含一些共同和特异序列。这可用于分离差异表达的基因。(3)cDNA文库的DNA无内含子、调节元件和基因间DNA。不能用于基因结构和调节的研究。一个基因经不同的剪接可产生不同的部分重叠的cDNA克隆。122.制备cDNA文库分离代表细胞中主要mRNA(rRNA和tRNA因其丰富和大小的一致性,可以通过分级直接分离)。mRNARNA的的提
7、提取取可以通过多胸腺嘧啶的柱子分离。然后被反转录。cDNA第一链的合成用oligo(dT)引物,因为长的mRNA没有被完全反转录,因此中部可加另一引物。第第二二链链cDNAcDNA的的合合成成是用自身引物的,一个更有效的方法是在cDNA第一链加尾(如多聚胞嘧啶),然后用oligo(G)为引物起始第二链的合成。这样产生的双链cDNA可以通过加接头或同聚尾巴插入载体。1314第二节 构建文库的载体一一.噬菌体载体噬菌体载体基础:裸露的噬菌体重组DNA转化宿主细胞或包装后转染宿主细胞。载体筛选:在细菌菌苔中形成噬菌斑。重组筛选: 插入载体通过可见标记的插入失活(cI基因的打断阻止溶源性,产生的噬菌体
8、更清澈;现代的载体携带lacZ基因,以兰-白筛选)。15 置换载体Spi-表型(对P2感染敏感性消失)是中心“ 填充片段”gam和red基因座丢失引起的。供体DNA的大小: 插入载体:0-10kbp; 置换载体:9-23kbp。 插入大小范围被有效形成噬菌斑的野生型基因组 75-105所限制。主要应用: 插入载体:cDNA克隆和表达文库;噬菌体展示。 置换载体:基因组DNA克隆。16二. 粘粒粘粒( (cosmid) )载体载体基础:包含噬菌体cos位点的质粒;导入宿主:经体外包装,再转染宿主细胞;载体筛选:类似于质粒重组筛选:可见标记插入失活和小片段插入的阳性筛选;供体DNA大小:30-45
9、kbp。插入大小范围被有效形成噬菌斑的野生型基因组 75-105所限制。主要应用:基因组文库构建。1718三.质粒载体构建cDNA文库19四.大容量克隆载体20(1)(1)细菌人工染色体细菌人工染色体(bacterial artificial chromosomes, BACs, fosmids)基础:大肠杆菌F质粒导入宿主:电转化载体筛选:显性选择标记重组筛选:插入片段大小供体DNA大小:300kbp主要应用:大基因组分析评论:低频率的重排和嵌合分子。载体在每个细胞中维持一个或两个拷贝,产生少量供体DNA。212223(2) P1P1载体和载体和P1P1人工染色体人工染色体(P1 artif
10、icial chromosomes, PACs)基础:噬菌体P1导入宿主:体外包装和转导载体筛选:显性选择标记重组筛选:应用对致死标记的打断进行阳性筛选供体DNA大小:约100kbp主要应用:大基因组分析评论:重排和嵌合分子少。载体维持低拷贝,但可以通过诱导噬菌体P1溶菌循环扩增。24(3)(3)酵母人工染色体酵母人工染色体(yeast artificial chromsomes, YACs)基础:酿酒酵母中心粒、端粒和ARS导入宿主:转化酵母原生质体载体筛选:显性筛选标记(营养缺陷型的恢复)重组筛选:插入片段大小供体DNA大小:2000kbp主要应用:大基因组分析,YAC转基因小鼠评论:YA
11、C的缺点是高频率的自发缺失,和克隆的嵌合化。重组载体的大小,需要电泳分析,有时难以区分内源性染色体。YAC维持低拷贝。2526第三节 文库的筛选一.基因组DNA文库的筛选筛选DNA文库是分离目的基因常用的方法;在成千上万的克隆中仅极少数含目的基因,且大多数基因的产物不具有可选择的表型特征,因此可采用以下策略来进行筛选:(1)用特异探针进行分子杂交;(2)用免疫和生化方法来检测基因产物;(3)用特异性引物进行PCR扩增。27二.cDNA的筛选(1)最佳的cDNA文库其mRNA在细胞中高水平特异表达;(2)有的目的mRNA的丰度极低,那么就应选择其丰度相对较高的细胞来构建文库,并要计算好文库应具有
12、的克隆数;(3)细胞中某种蛋白质的表达量常常是表明mRNA丰度的敏感指标。2829探针的特异性可通过以下的策略来解决: 选基因的特异序列为探针; 长度不低于1720Nt; 控制退火温度。碱基的简并性可通过以下的策略来解决: 选用简并程度最低的序列; 选用使用频率最高的密码子; 简并密码子的第3个碱基可用H; 应用混合探针; 控制退火温度。30 三. 应用寡核苷酸探针来分离目的基因1.寡核苷酸探针的来源(1)从某一物种分离到的基因序列可作为另一物种的核酸探针;(2)由蛋白质保守区中相邻的67个氨基酸推导合成出核酸探针。 合成探针时必须考虑到: 探针的特异性; 碱基的简并性。31四.假阳性克隆的克
13、服应用混合探针分离克隆基因虽取得了良好的效果,但也会产生相当数量的假阳性。克服假阳性的方法有二:(1)制备“ 猜测体(guessmer)” 探针 猜测体 探针是根据特定物种某已知蛋白的密码子使用频率,选择含有密码子简并程度最低的蛋白质区段进行人工合成的低简并性寡核苷酸探针。3233猜测体探针只要有85的 碱基能和目的基因配对即可杂交。如连续的配对区较长(达1012Nt),那么猜测体探针作用的强度足以鉴定出含目的基因的阳性克隆。如错配的核苷酸均匀分散在探针分子的各部位,那么这种猜测体探针就不会和目的基因的序列杂交。提高杂交温度,以减少假阳性。34(2)PCR猜测体技术 测定尿酸氧化酶末端一段32
14、aa的序列; 根据此段顺序两侧的序列推测,合成一组引物; 从猪肝中提取mRNA,反转录成cDNA,用以上 述引物对此cDNA进行特异扩增。 扩增产物连接到载体上进行克隆,并用唯一猜 测体探针进行杂交,选择阳性克隆。此猜测体 探针是按32aa序列推导猜测而来的。 分离的克隆中部为上述32aa,两端为引物序列。 用这段插入序列为探针,在严格条件下筛选 噬菌体cDNA文库。3536 五.应用差别杂交或 扣除杂交法分离克隆的目的基因(一)差别杂交(diffential hybridization)1.差别杂交要拥有两种细胞群体:在一个细胞群体中目的基因正常表达,而另细胞群体中目的基因不表达。2.制备两
15、种不同的mRNA提取物。一种含一定比例目的基因mRNA的总mRNA;另一种不含目的基因mRNA的总mRNA;3.通过这两种总mRNA为探针的平行杂交对目的基因cDNA克隆文库进行筛选。3738(二)扣除杂交差减杂交的缺点: (1) 灵敏度低 (2)重复性差 (3)需用大量的杂交膜,工作量大,费时, 费钱 故可用扣除杂交来筛选,扣除杂交也可用来分析缺失突变基因3940(三).用差别显示分离克隆的目的基因DDRTPCR4142(四)用免疫的方法分离克隆的目的基因1.用靶蛋白制备抗体2.用这种抗体制备抗抗体,一扩大信号。3.标记抗抗体;4.进行免疫实验。434445六.筛选YAC文库从理论上只要分离
16、到大量的基因组克隆,并构建它们的限制图就可鉴别出重叠的基因组克隆,进而构建出全基因组的物理图。实际上是很困难的。(1)重叠的片段多,重叠的长度不均衡;(2)工作量大; 一个标准的YAC文库插入片段的总和相当于58个基因组大小,则需约500个96孔板和相应数量的杂交膜。因此,一般采Locus- specfic PCR来筛选。用“ 集”(pool)为单位(相当于4块96孔板)或用“ 超级集”(相当与20块96孔板)逐轮筛选,逐步缩小筛选范围。46七.基因定位克隆基因定位克隆 (map-based cloning)是用于分离未知结构的目的基因。从理论上说,任何已鉴别的突变基因都可用这种方法分离出来。
17、条件是: (1)已建立含此基因的YAC文库; (2)要有与目的基因紧密连锁的标记(已知基因或分子标记)。 47( (一一).).染色体体步移法染色体体步移法(chromosome walking)(1)方法: 在人类和其它动物的定位克隆可用染染色体体步移法:色体体步移法:用邻近的标记为探针,在基因组文库中筛选重叠克隆。直到目的基因被克隆出。(2)步移的方向和进度可通过中期染色体原位分子杂交来确定。(3)大范围染色体步移有困难,因存在重复顺序而不能进行分子杂交。(4)此可通过染色体跳跃(chromosome jumping) 来克服。4849(二)染色体跳跃和跳查文库跳查文库(jumping library)这种文库的特点是每一克隆中含有原先相距很远的2个DNA片段。跳查文库是分离基因或特定DNA序列的有效筛查方法。5051(三)连锁文库(linking library)为了使筛查朝一个方向进行下去,要建立连锁文库。使钓出的片段和上一个片段相邻接。 跳查探针 连锁探针5253