拟南芥SBP转录因子基因家族分析

上传人:ldj****22 文档编号:45249632 上传时间:2018-06-15 格式:PDF 页数:25 大小:971.97KB
返回 下载 相关 举报
拟南芥SBP转录因子基因家族分析_第1页
第1页 / 共25页
拟南芥SBP转录因子基因家族分析_第2页
第2页 / 共25页
拟南芥SBP转录因子基因家族分析_第3页
第3页 / 共25页
拟南芥SBP转录因子基因家族分析_第4页
第4页 / 共25页
拟南芥SBP转录因子基因家族分析_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《拟南芥SBP转录因子基因家族分析》由会员分享,可在线阅读,更多相关《拟南芥SBP转录因子基因家族分析(25页珍藏版)》请在金锄头文库上搜索。

1、拟南芥 SBP 转录因子基因家族分析 北京大学 罗静初 1拟南芥拟南芥 SBP 转录因子基因家族分析转录因子基因家族分析 本章提要 本章以植物特异转录因子 SBP 基因家族为实例, 讲述如何利用生物信息数据库资源和软件 工具,对该家族进行系统分析。本章所用数据主要来自北京大学生物信息中心构建的植物转录 因子数据库,研究对象主要为拟南芥基因组中 16 个 SBP 转录因子基因。所用生物信息学工具 包括基因结构显示、双序列比对、蛋白质功能域识别、蛋白质保守域预测、序列图标构建、多 序列比对、系统发育树构建、表达谱分析,以及蛋白质三维结构空间图形显示等。研究结果表 明,SBP 基因家族为绿色植物所特

2、有,在拟南芥基因组中有 16 个基因座,其基因结构差异很 大,经可变剪接得到 27 个转录本,编码 16 个 SBP 转录因子,其蛋白质序列 DNA 结合结构域 保守序列为 79 个氨基酸残基,含两个互不重叠的锌指结构序列模体。基因结构、系统发育和 蛋白质序列保守结构域分析表明, 上述 16 个 SBP 基因可分为 4 组, 每组中均有一对重复基因。 不同组基因结构和所编码蛋白质序列差异很大,可能与该基因家族功能多样性有关。 引言 我们知道, 转录前调控、 转录调控和转录后调控是真核生物基因表达调控的重要组成部分, 其中转录调控通过顺式作用元件和反式作用因子相互作用实现。顺式作用元件(cis-

3、element) 泛指 DNA 序列一个片段,通常位于被调控基因的上游,主要包括启动子(promoter)、增强子 (enhancer)和抑制子(suppressor)三类。反式作用因子泛指与顺式作用元件直接或间接结合 并参与靶基因转录过程的调控因子,通称转录因子(transcription factor)。转录因子可以分为 两大类,即通用转录因子(general transcription factor)和特异转录因子(specific transcription factor)。通用转录因子与靶基因上游约 10-35 位的 TATA 框(TATA-box)或启动子区域转录 起始位点(tra

4、nscription start site)DNA 序列结合,并与 II 型 RNA 聚合酶一起,形成转录起始 复合物。特异转录因子种类繁多、功能复杂,它们与靶基因上游各种特定 DNA 序列片段结合, 激活或抑制靶基因转录活性, 以调控靶基因在不同组织、 不同细胞、 不同环境条件下特异表达。 如无特别说明,通常所说的转录因子即指特异转录因子。 转录因子蛋白质序列除包含 DNA 结合结构域(DNA binding domain,DBD)外,一般还 含有转录调控结构域(transcription regulation domain),主要用于调控靶基因转录活性,既可 激活转录,也可抑制转录。转录因

5、子中的核定位信号(nuclear localization signal, NLS),可引 导转录因子在胞浆内合成后通过核膜进入细胞核。此外,有些转录因子含寡聚化结构域,可形 成二聚体或多聚体复合物,具有更为复杂的调控机制。 显然,DNA 结合结构域是转录因子必须具备的功能单元,具有特定空间结构,常见的有 锌指(zinc finger)结构、螺旋转角螺旋(helix-turn-helix)、螺旋回环螺旋 (helix-loop-helix)、亮氨酸拉链(leucine zipper)等。通常,转录因子 DNA 结合结构域特定 部位(如 alpha 螺旋)嵌入 DNA 双螺旋大沟,蛋白质序列上精

6、氨酸、赖氨酸等带电或极性残基 与 DNA 序列上碱基结合,结合位点(transcription factor binding site, TFBS)碱基序列特异性决 定了能够与其结合的转录因子种类。 植物转录因子数据库 按照DNA结合结构域序列特征,可以将转录因子分为不同种类,即不同家族。2000 年, 植物中第一个模式生物拟南芥 (Arabidopsis thaliana) 全基因组测序完成 (AGI, 2000) 。 Riechmann拟南芥 SBP 转录因子基因家族分析 北京大学 罗静初 2等通过文献检索,收集整理了已知植物转录因子家族,预测了拟南芥基因组共编码 1533 个转 录因子,

7、占拟南芥总基因数 5.9%,其中 45%是植物特异转录因子(Riechmann et al., 2000)。 2003 年,北大耶鲁合作中心等研究组对拟南芥全基因组转录因子进行了cDNA克隆,得到了 1200 多个拟南芥转录因子基因的cDNA序列 (Gong et al., 2004) , 并进一步开展蛋白质/蛋白质、 蛋白组/DNA相互作用研究。 2005 年, 我们通过文献调研, 收集了 64 个植物转录因子家族信息, 其中 48 个已经由蛋白质家族数据库PFAM收录,建立了DNA结合结构域隐马氏模型序列谱 (HMM Profile),可以用来预测拟南芥基因组中该 48 个家族转录因子。另

8、外 16 个家族则可 根据文献报道, 以DNA结合结构域为种子序列, 用BLAST程序搜索拟南芥基因组中可能的同源 基因。利用上述两种方法,预测得到 1922 个拟南芥转录因子,并进行了基于家族水平和基因 水平的注释,构建了拟南芥转录因子数据库(http:/,DATF)。之后,又构 建了水稻(Oryza sativa)、杨树(Populus pinus)、苔藓(Physcomitrella patens)、衣藻 (Chlamydomonas reinhardtii)等具有全基因组序列的植物转录因子数据库,以及玉米、棉花 等正在进行EST测序的植物转录因子数据库( http:/),并提供了统一

9、的浏览、检索和数据下载界面(Guo et al., 2008)。 例如,拟南芥转录因子数据库 DATF 搜集的 SBP 转录因子家族共有 16 个基因, 其中大 部分已有文献报道(Gardon et al., 1999),并按类 SBP 基因(SPL)的方式命名。DATF 中每 个转录因子均有染色体定位编码信息, 如 At1G53160, “At”为拟南芥拉丁名 Arabidopsis thaliana 的双字母缩写,1G 表示该转录因子基因位于 1 号染色体,53160 为编号。若该基因有不同剪接 方式,则在后面缀以数字以示区别,如 At1G53160.1,At1G53160.2 等。每个基

10、因均有详细注 释,主要包括(图 1)以下内容。 ? 基本信息:基因编码、名称、基因全长、CDS 编码序列长度、所编码蛋白质序列长度 和理论分子量,以及该基因的简单说明。 ? 基因结构:编码方向、染色体定位、编码区起始和终止位置,并用图形方式显示基因 结构。 ? 蛋白质结构域:结构域名称、简介、起始和终止位置, 并用图示方式显示结构域信息。 ? 表达信息:不同剪接方式的 EST 信息。 ? 基因本体注释系统:从 InterPro 注释结果得到的该基因 GO 注释。 ? 交叉链接:NCBI 数据库 GenBank 和 GenPept,拟南芥基因组数据库 TAIR、TIGR、 MIPS 和 SIGn

11、al T-DNA Express,TRANSFAC、PubMed。 ? 序列信息:全长基因、蛋白编码序列 CDS、所编码蛋白质序列。 ? 其它注释信息:基因复制、核定位信号、UniGene 注释,以及克隆和测序信息等。 除了对每个转录因子进行详细注释外, 根据文献报道, 对每个家族也进行了概要介绍, 包括结合位点顺式元件信息、已知 DNA 结合结构域三维结构信息,并提供了 DNA 结合结 构域多序列比对结果和系统发育树。 拟南芥 SBP 转录因子基因家族分析 北京大学 罗静初 图1 - 拟南芥SBP转录因子基因AtSPL4 第一个剪接体AT1G69170.1的注释信息 A: 基本 信息;B:

12、基因和蛋白质结构域信息;C: 数据库注释和交叉索引;D: 序列信息 拟南芥 SBP 转录因子基因家族研究背景 拟南芥转录因子数据库 DATF 中部分为植物特异转录因子家族, 至今只在植物中发现, SBP 基因家族就是一个植物特异转录因子家族。 1996 年, 德国科隆植物育种马普研究所 (Max Planck Institute for Plant Breeding Research)Huijser 领导的研究小组从金鱼草(Antirrhinum majus)中 克隆得到两个基因, 它们能与花发育相关基因Squamosa的启动子结合并调控其表达 (Klein et al., 1996),命名为

13、 Squamosa 启动子结合蛋白(Squamosa promoter Binding Protein, SBP),简称 SBP1 和 SBP2。之后,先后在拟南芥和苔藓中进行了 SBP 基因家族的 cDNA 克隆,发现在这 两个植物中有多个 SBP 转录因子基因拷贝(Cardon et al., 1999; Riese et al., 2007)。由于多数基 因尚未进行功能鉴定,Huijser 等将它们称为类 SBP(SBP-like, SPL)基因。因为这些基因都有 编码 DNA 结合结构域的保守核苷酸序列,又称为 SBP 盒(SBP-box)基因,SBP 盒编码的蛋 白质序列称 SBP

14、结构域(SBP-domain),含 79 个氨基酸残基。Yamasaki 等(2004)利用核磁 共振方法测定了拟南芥中两个 SBP 结构域的三维溶液构象,均含 2 个锌指结构(Zinc finger)。 其中一个(SPL3)N-端锌指结构序列模体为 Cys3His,-端锌指结构为 Cys2HisCys;另一个 (SPL7)N-端锌指结构序列模体为 Cys4,-端锌指结构与 SPL3 相同,也是 Cys2HisCys。其 与 SBP 结构域结合的顺式元件具有以 GTAC 为核心的迴文结构。SBP 结构域 C 端富含碱性氨 基酸,可能为双向核定位信号(nuclear localization s

15、ignal, NLS)(Birkenbihl et al., 2005)。 据文献报道, SBP 转录因子家族具有许多重要生物学功能, 包括花和果实发育、 孢子发育、 激素应答、抗霉菌侵蚀等。拟南芥 SPL3 基因的转录受发育调控,主要集中在花序顶端分生组 织、花分生组织和花器官原基,可能与控制开花时间有关(Cardon et al., 1997)。拟南芥 SPL8 基因影响孢子囊发育,进而影响植物生殖(Unte et al., 2003),并可能在赤霉素介导的发育过3拟南芥 SBP 转录因子基因家族分析 北京大学 罗静初 4程中起局部调节作用(Zhang et al., 2006)。最近报道

16、证实,拟南芥三个 SBP 基因(SPL3、SPL4 和 SPL5)中具有 microRNA156 的调控位点(Wu, 2006; Gandikota et al., 2007)。 除拟南芥外, 其它植物SBP转录因子研究也屡有报道。 玉米SBP转录因子Liguleless1 (LG1) 缺失突变体不能形成舌叶和叶耳(Moreno et al. 1997)。白桦 BpSPL1 基因能特异结合 BpMADS5 启动子,参与调节花发育 (Lannenpaa et al. 2004)。衣藻(Chlamydomonas reinhardtii)中铜应答 调控子 1 (Copper Response Regulator 1, CRR1) 基因含典型的 SBP 结构域 (Eriksson et al. 2004; Kropat et al., 2005)。最近研究表明,SBP 基因在植物果实成熟和发育中起重要作用。野生玉 米(teosinte)粒有硬壳包

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号