一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析

上传人:l****6 文档编号:39071342 上传时间:2018-05-11 格式:DOC 页数:6 大小:36.50KB
返回 下载 相关 举报
一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析_第1页
第1页 / 共6页
一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析_第2页
第2页 / 共6页
一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析_第3页
第3页 / 共6页
一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析_第4页
第4页 / 共6页
一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析》由会员分享,可在线阅读,更多相关《一条家族性急性髓系白血病相关新基因ELF2C的生物信息学分析(6页珍藏版)》请在金锄头文库上搜索。

1、1一条家族性急性髓系白血病相关新基因 ELF2C 的生物信息学分析作者:王程毅, 王少元, 张轶文, 李景岗【摘要】 目的 利用生物信息学技术对新克隆的家族性急性髓系白血病相关新基因 ELF2C 和其蛋白序列进行分析,初步探讨其功能。 方法 以人类基因组数据库为基础,利用生物信息学程序预测 ELF2C 的基因结构、染色体定位、编码蛋白质的理化性质、亚细胞定位、蛋白质功能域等。 结果 ELF2C 基因定位于 4q31.1,全长 2 257 bp,含有 432 bp 的开放阅读框,可编码 143 氨基酸的蛋白质,且编码蛋白定位于核内,具有多个修饰位点和功能基序,是一个功能活跃的蛋白质。 结论 EL

2、F2C 基因可能是在家族性急性髓系白血病发生发展中具有生物功能的一条全长新基因。 【关键词】 系谱; 白血病;粒细胞,急性; 基因; 计算生物学; 序列分析,DNA为寻找家族性急性髓系白血病特异相关基因,笔者应用抑制性消减性杂交(suppression subtractive hybridization,SSH)构建了家族性急性髓系白血病 cDNA抑制性消减文库,以其中一条家族性急性髓系白血病中差异表达的代表新基因的EST(zywb4)片断为基础1,综合应用电子克隆和 SMART RACE 等分子生物学技术,从此家族性急性髓系白血病患者骨髓标本中克隆出其 cDNA 全长,命名为ELF2C(Ge

3、nBank accession number:DQ359746)2。为进一步探讨 ELF2C 的基因结构和生物功能,笔者应用生物信息学分析技术对 ELF2C 基因进行初步分析研究,报道如下。21 材料与方法1.1 材料1.1.1 标本 骨髓标本取自福建省一高发白血病家族中之一患者(M2),男性,11岁。按 GeneBallTM Genome Preparation Kit 说明书进行基因组 DNA 的提取,TE溶解,调至 0.5 g/L 后,-80 保存。1.1.2 主要仪器与试剂 GeneBallTM Genome Preparation Kit (日本 TaKaRa 公司),TOPO TA

4、 Cloning Kit、质粒载体 pCR2.1 TOPO、感受态细胞TOPO10、X gal、IPTG、Platinum Taq DNA Polymerase High Fidelity(美国Invitrogen 公司)。其余试剂为国产或进口分析纯试剂。PCR 扩增仪(2720 型,美国 Perkin Elmer 公司)。1.2 方法1.2.1 基因核酸序列信息 基因组定位采用 NCBI 的 MegaBLAST 工具和 UCSC的 BLAT Search Genome 程序:利用 MegaBLAST 工具检索人类基因组数据库,参数取默认值,用 map viewer 观看基因组定位及外显子、内

5、含子等基因结构。运行BLAT Search Genome 程序检索人类基因组数据库,直接观察基因组定位及外显子、内含子等基因结构。利用 Sim4 工具(http:/biom3.univ lyon1.fr/sim4.php)和LalnView2.2 软件将 mRNA 序列对齐到相应的基因组序列以验证基因结构。利用GeneBuilder、NCBI/ORF Finder 程序分析其对应的基因结构。1.2.2 基因编码的蛋白序列信息 Expasy 站点(http:/www.expasy.org/)的ProtParam 工具预测蛋白质的理化性质,ProtScale 工具预测亲水性轮廓。PSORT II(

6、http:/ psort.ims.u tokyo.ac.jp /form2.html)预测亚细胞定位信息;TMHMM 服务器(http:/www.cbs.dtu.dk/ services/TMHMM/)预测跨膜信息。InterProScan ( 3http:/www.ebi.ac.uk/InterProScan/)预测蛋白质功能域与结构域。SMART 服务器(http:/ smart.embl heidelberg.de/)分析蛋白质序列结构功能域。ELM(http: /elm.eu.org/) 预测蛋白质功能性位点。利用 BlastP 工具查询 NCBI 的非冗余蛋白质数据库以了解其他物种中

7、是否有相似的蛋白质存在。查询参数取默认值即可。1.2.3 下游剪切位点的检测 对第五外显子设计引物,包括其 mRNA 剪切位点做PCR,采用 Invitrogen 的高保真酶做长距离 PCR,其流程如下:向 50 L PCR 反应管中加入以下试剂:39.3 L 去离子水、5 L 10Taq DNA Polymerase Buffer、1 L dNTP(10 mol/L)、0.2 L Taq DNA Polymerase、2 L MgSO4、1 L ELF2 Exon5 1F(20 mol/L)、1 L ELF2 Exon5 1R(20 mol/L)和 0.5 L 基因组 DNA,振荡混匀、离心

8、沉底,扩增 35 个循环,用 2.0%琼脂糖凝胶电泳并回收所需条带,克隆至 pCR2.1 TOPO Vector 连接,转化 TOPO10,于涂有 X gal 和IPTG 的 LB/Amp 平板上培养。通过质粒 PCR 反应和 EcoR酶切反应鉴定重组子。阳性重组子同时送日本 TaKaRa 公司和美国 Invitrogen 国内分公司测序。PCR 反应引物:上游:5 AGAGCAAGACTCCGTCTCC 3下游:5 CTCCCCACCTACTTCCAAATC 32 结 果2.1 基因核酸序列信息 利用 MegaBLAST 工具将基因 ELF2C 全长序列对人类基因组数据库进行检索,发现其位于

9、人类染色体 4q31.1 上,具有 4 个外显子和 3个内含子,在染色体上与 ELF2 基因的部分外显子位置一致(图 1)。BLAT Search Genome 程序也确证了该结果。 a:ELF2C 的染色体定位,位于 4q31.1;b:ELF2C 4的基因结构,可以看出其具有 4 个外显子和 3 个内含子;箭头方向为转录方向.利用 Sim4 工具将 ELF2C/ELF2 序列和对应基因组序列进行联配,发现这两个基因内含子/外显子的边界都符合 GT/AG 剪切模式,LalnView2.2 也直观地看出ELF2C 基因在染色体上具有 4 个外显子和 3 个内含子,ELF2 基因具有 7 个外显子

10、和 6 个内含子(见图 2)。a:ELF2C(即原先的 zywb4)基因在染色体上具有 4 个外显子和 3 个内含子;b:ELF2 基因具有 7 个外显子和 6 个内含子.图 2 ELF2C 和 ELF2 基因组结构Fig 2 Gene structure of ELF2C and ELF2 对比 ELF2C 和 ELF2 的外显子序列以及二者的蛋白质序列发现:ELF2C 第四个外显子在 3方向比 ELF2 的 3方向多了 1 674 个碱基,这可能是 ELF2C 对应的基因组在第五个外显子的剪切位点发生小片缺失和点突变,以至无法正常剪切而导致转录终止,在 ELF2 的第五个外显子上游剪切位点

11、附近设计引物,证实这种假设;基因结构 GeneBuilder 分析显示,发现在 ELF2C 基因第一外显子及其上游 439 bp 到下游 2 000 bp 的区域是 CpG 密集富含区(CpG 岛),但启动区缺乏明显的 TATA 同源盒;NCBI/ORF Finder 程序发现从第 150 至 581 位核苷酸之间含有一个 431 bp 的开放读码框架(ORF),编码具有 143 氨基酸的蛋白质,登陆 GenBank,获得蛋白注册号:ABD15131。2.2 基因编码的蛋白序列信息 将基因 ELF2C 的蛋白质参考序列提交至ProParam,预测其分子量为 15 584.6,理论等电点为 6.

12、30,半衰期在体外人网织红细胞为 30 h,被分类为不稳定蛋白质。ProScale 未见该蛋白有明显的亲疏水性倾5向。提交至 PSORT II,提示该蛋白很有可能定位于核内。TMHMM 服务器预测未见跨膜结构。将该序列提交至 InterProScan,可发现在 58134 氨基酸为部分 ETS结构域,提示其与 ets 转录因子家族相关。应用 SMART 发现有DSL、ZnF_TAZ、AT_hook 三个结构域。ELM 查询发现该蛋白具有枯草杆菌蛋白酶异构酶(SKI1)裂解位点、FHA(forkhead associated)功能域作用基序、III 型 PDZ配体结合基序、SH2(STAT5 S

13、rc Homology 2)结构域结合基序、WW4 域作用基序及 CK1、CK2、GSK3 磷酸化位点等。利用 BlastP 工具,发现 ELF2C 与 E74 like factor 2(即 ELF2)前 1134 个氨基酸比对一致。2.3 下游剪切位点的检测 对第五外显子设计引物,包括其 mRNA 剪切位点做PCR(图 3),割胶回收,克隆测序,发现 mRNA 剪切位点未出现异常。 3 讨 论应用 BLAST、SAMRT 等软件工具,可以知道: (1)ELF2C 序列和 ELF2 是来自同一段 hnRNA;(2)zywb4 全长序列的前 3 个外显子的剪接位点符合 GT/AG 剪切模式;(

14、3)长距离 PCR 实验证明 zywb4 全长序列确实存在2。因此,ELF2C 序列很可能为 ELF2 的可变剪切体。将 ELF2C 全长序列的外显子与 ELF2 的外显子分别对齐后发现:ELF2C 转录提前终止,缺失关键的 ETS 结构域。其原因可能为:(1)第五个外显子的剪切位点突变;(2)剪切调节因子的功能丧失。笔者的实验证明第五个外显子的上游剪切位点没有发生突变,那么最大可能是剪切调节因子的功能丧失,而剪切调节因子的功能丧失也易导致疾病的发生,如人类强直性肌营养不良,它的选择性剪切调节因子 CUG BP 水平升高,功能失常,导致肌肉特异性氯离子通道 1 因子(muscle specif

15、ic chloride channel 1,CIC1)保留了第 2 个内含子,引起疾病发生3。笔者在 ELF2C 基因的启动子区以及 5区发现密集 CpG6岛,近年来的研究资料显示,基因组 DNA CpG 岛的甲基化修饰在多步致瘤模式及肿瘤进展复发中起着重要作用,如抑癌基因 p15 启动子区的 CpG 岛在 88 %成人急性髓系白血病中发生超甲基化,p16 RARbeta 和 APC 等基因在不同类型的急性白血病中也有类似改变4 5。故推测 ELF2C 基因的调控可能也会受到甲基化的影响。笔者对 ELF2C 启动子区域所含基本转录调控元件分析,发现缺乏明显的 TATA 同源盒,这种情况多见于两

16、类基因,一种是管家基因,另外一种是与发育相关或免疫系统发育形成相关的基因。ELF2C 作为 ets 转录因子家族的 ELF2的可变剪切体,故提示该基因可能与调控细胞生长发育相关。目前对 ets 转录因子家族的 ELF2 的实验研究仅有 Wilkinson DA 报道发现了ELF2 两个剪接体 ELF2A/2B6,并于当年提交注册 GenBank,但这两个剪接体的功能至今还不明了,很可能它们在机体中发挥相反的作用,与 RBTN 2 相互作用影响着 T 细胞的生长。在 ELF2C 的蛋白组学分析上,笔者发现 ELF2C 含有 DSL(delta serrate ligand、锯齿形配体)、ZnF_TAZ(全称 TAZ zinc finger、TAZ 锌指结构)、AT_hook((DNA binding domain with preference for A/T rich regions、A/T 碱基的DNA 结合域)结构域,缺乏 ELF2A/2B 的完整的 ETS 结合域和 RBTN 2 结合域

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 医学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号