人新基因EOLA1生物信息学分析

上传人:l****6 文档编号:39076057 上传时间:2018-05-11 格式:DOC 页数:7 大小:41KB
返回 下载 相关 举报
人新基因EOLA1生物信息学分析_第1页
第1页 / 共7页
人新基因EOLA1生物信息学分析_第2页
第2页 / 共7页
人新基因EOLA1生物信息学分析_第3页
第3页 / 共7页
人新基因EOLA1生物信息学分析_第4页
第4页 / 共7页
人新基因EOLA1生物信息学分析_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《人新基因EOLA1生物信息学分析》由会员分享,可在线阅读,更多相关《人新基因EOLA1生物信息学分析(7页珍藏版)》请在金锄头文库上搜索。

1、1人新基因 EOLA1 生物信息学分析作者:刘月明,刘战立 刘漪沦,许雪峰,张萍,马兵【摘要】 目的 预测人类新基因 EOLA1 的生物学功能。方法 基于 EOLA1 全长cDNA 序列,应用生物信息方法,从序列比对、染色体定位、基因结构分析、编码蛋白理化性质分析、蛋白质位点和序列模式预测等几个方面对 EOLA1 进行分析。结果 EOLA1 编码的蛋白 EOLA1 经网上同源性比对没有发现与之高度同源的人类已知蛋白;EOLA1 与鼠 111002L19 蛋白高度同源,到目前为止,对鼠 111002L19 蛋白功能也不清楚;应用辐射杂交细胞系(RH)作图系统发现 EOLA1 定位于 Xq27.4

2、;对其二级结构进行预测发现在 EOLA1 蛋白分子中存在酪氨酸激酶和蛋白激酶C 磷酸化位点以及 1 个螺旋 转角 螺旋(HTH)基序。结论 人新基因 EOLA1 编码蛋白质的一级和二级结构特征赋予 EOLA1 信号转导能力,有可能作为信号分子在 LPS 激活人血管内皮细胞的过程中发挥作用。 【关键词】 新基因;EOLA1;生物信息学【Abstract】 Objective To explore the biological function of human novel gene EOLA1.Methods Many bioinformatics methods were used to an

3、alyses and predict the function of EOLA1 based on the full length cDNA of EOLA1.Results We didnt find any human protein high homologous with EOLA1 by homology comparison on line.However,EOLA1 was high homologous with rat 111002L19 protein of which the function was unclear up to now.The genomic DNA o

4、f EOLA1 contained 5 exons,spanning about 6 294 bps,and was mapped to human chromosome Xq27.4.We found that EOLA1 secondary structure contained helix, Lamellosa and turn,and a helix turn helix(HTH)motif by bioinformatics analysis.We scanned PROSITE of EOLA1 on line,and found that EOLA1 contained:(1)N

5、 glycosylation site(36 39 NCTI);(2)Protein kinase C phosphorylation site(7 9 SFR,33 35 SQR);(3)Casein kinase II phosphorylation site(100 103 TPDE).Conclusion The information got by bioinformatics analysis indicates that EOLA1 may play an 2important role in process of Human vascular endothelial cell

6、activation as a transcription factor.【Key words】 novel gene;EOLA1;bioinformatics随着人类基因组计划和越来越多的真核生物基因组完成,现代基因工程学已经步入了后基因组时代1。研究的热点从基因测序转移到基因功能表达与调控。近年来可用的基因序列与结构信息的指数级增长,生物信息学领域,或称之为计算生物学(computational biology)领域在基础生物医学领域起着越来越大的作用2。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。基因组信息学的关键是“读懂”基因组的

7、核苷酸顺序,即全部基因在染色体上的确切位置以及各 DNA 片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计3 4。了解基因表达的调控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病的诊断、治疗内在规律。它的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”,解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分5 6。人类对基因的认识,将从以往的对单个基因的了解,上升到在整个基因组水平上考察基因的组织结构和信息结构,考察基因之间在位置、结构和功能上的相互关系7 8。近来的研究表明,基因组不仅

8、是基因的简单排列,它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄清楚生物体基因组特有的组织结构和信息结构是解译生命遗传语言的关键。Oti等9对疾病的潜在基因进行预测和优先排序,对不同的生物信息学策略进行了总结,并列举了一些有用的网络工具和生物信息学方法,为研究疾病相关基因提供了3范例。EOLA1 是本课题组于 2002 年应用抑制消减杂交技术发现的人类新基因10,本研究中我们基于 EOLA1 全长 cDNA 序列,应用目前比较成熟的生物信息学分析方法对 EOLA1 基因从以下几个方面对其进行比较详细的生物信息学分析:序列比对;EOLA1 在人

9、类染色体上的定位;EOLA1 结构分析;编码蛋白理化性质分析;编码蛋白的蛋白质位点和序列模式预测。1 材料与方法1.1 序列比对http:/www.ncbi.nlm.nih.gov/BLAST/,输入 EOLA1 的全长序列,应用 BLAST 工具进行比对分析。对于比对计算产生的分值,用统计学方法加以说明,以了解比对结果是否具有统计学意义。相关的参数 E 代表随机比对分值不低于实际比对分值的概率。对于严格的比对,E 值必须低于一定阈值才能说明比对的结果具有足够的统计学意义,排除了由于偶然的因素产生高比对得分的可能11。1.2 EOLA1 在人染色体上的定位通过基因与基因组重叠群的序列比对,可以

10、快速有效地把基因定位在基因组中。以 EOLA1 全长序列检索 GenBank 数据库中的 UniGene 库,查找与其对应UniGene 序列簇(http:/www.ncbi.nlm.nih.gov/UniGene/clust.cgi),获得 1 个同源序列簇,再经网上辐射杂交细胞系(RH)作图系统(http:/www.ncbi.nlm.nih.gov/genemap)确定 EOLA1 在染色体定位12。1.3 EOLA1 基因结构分析登陆 NCBI 相应的网站分析 EOLA1 cDNA 序列中重复片段、编码区、启动子、4内含子/外显子、转录调控因子结合位点等信息。1.4 EOLA1 编码蛋白

11、的理化性质分析蛋白序列分析软件包 ANTHEPROT 4.3 是法国的蛋白质生物与化学研究院开发出的蛋白质研究软件包。软件包包括了蛋白质研究领域所包括的大多数内容,功能非常强大。应用此软件包,使用个人电脑,便能进行各种蛋白序列分析与特性预测。我们应用该软件对 EOLA1 的理化性质进行了详尽的分析。1.5 EOLA1 编码蛋白的二级结构和序列模式预测二级结构是指 螺旋和 折叠等规则的蛋白质局部结构元件。不同的氨基酸残基对于形成不同的二级结构元件具有不同的倾向性。按蛋白质中二级结构的成分可以把球形蛋白分为全 蛋白、全 蛋白、+ 蛋白和 / 蛋白等 4 个折叠类型。预测蛋白质二级结构的算法大多以已

12、知三维结构和二级结构的蛋白质为依据,用人工神经网络、遗传算法等技术构建预测方法13 14。还有将多种预测方法结合起来,获得“一致序列”。总的来说,二级结构预测仍是未能完全解决的问题,一般对于 螺旋预测精度较好,对 折叠差些,而对除 螺旋和 折叠等之外的无规则二级结构则效果很差。二级结构预测我们仍然用 ANTHEPROT 4.3 软件进行。对于蛋白位点和序列模式预测在http:/www.expasy.ch/swissmod/SWISS MODEL.html 网站上进行。1.6 EOLA1 编码蛋白的同源性比对分析和三维结构预测蛋白质的三维结构是蛋白质在体内发挥功能的存在形式,能够提供丰富的功能5

13、信息。本研究应用 SWISS MODEL Workspace 蛋白质模建平台对 EOLA1 编码的蛋白质进行同源性比对分析和三维结构预测15 16。该平台可以提供在线分析,网址是:http:http:/swissmodel.expasy.org/.根据提示,输入 EOLA1 氨基酸序列即可反馈同源性蛋白信息和三维结构预测结果。2 结果2.1 人新基因 EOLA1 在 GenBank 中的序列比对结果http:/www.ncbi.nlm.nih.gov/BLAST/,输入 EOLA1 的全长序列,应用 BLAST 工具进行比对分析,共有 67 条序列和 EOLA1 具有同源性,其中分值大于或等于

14、 200且 E 值小于 0.01 的共有 14 条,多为人类新 mRNA 或假想蛋白的编码序列(图 1)。EOLA1 和鼠 RIKEN 基因有 77%的同源性,关于该基因的相关信息可以参考文献15。2.2 EOLA1 在人染色体上的定位以 EOLA1 cDNA 序列检索 GenBank 数据库中的 UniGene 库,查找与其对应UniGene 序列簇,获得 1 个同源 UniGene 序列簇 UniGene Cluster Hs.82171(http:/www.ncbi.nlm.nih.gov/UniGene/clust.cgi).UniGene 来自于对GenBank 中序列(尤其是 ES

15、T)自动拼接而形成的序列簇,每一个序列簇可以代表 1个唯一的基因,且经网上辐射杂交细胞系(RH)作图系统(http:/www.ncbi.nlm.nih.gov/genemap)已将每个序列簇在染色体上位置作了确定,因此,UniGene 将基因的染色体定位、组织表达谱和同源序列有机地整合在一起。通过比较 EOLA1 序列与 UniGene 序列簇的同源性可将其定位于染色体的相应位置,如图 2 所示将 EOLA1 定位于人染色体 Xq27.4.表 1 EOLA1 基因的内含子大小6及内含子/外显子边界以 EOLA1 cDNA 序列为起始,查找人 X 染色体,显示其从1523702211523765

16、15 跨越了 6 294 bp,被内含子分割为 5 个外显子,见图 3,其中外显子用黑框显示,内含子大小用 kb 显示。所有的外显子 内含子边界序列遵循AG/GT 规则(表 1)。图 3 EOLA1 基因的基因组 DNA 结构Fig.3 The genome DNA structure of EOLA1分析第一个外显子上游 5 侧翼区 2 kb 序列,在-704 kb-681 kb 含预测的启动子,但无典型的 TATA box 结构,在该区域附近可找到几个推导的转录因子结合位点,如 SP1、GATA 1、TFA、GREB、Pit 1、AP 2B 和 NF 1.至于该区域内是否含真正转录启动子尚须进一步的实验研究。http:/www.ncbi.nlm.nih.gov/ORF,在 EOLA1 基因全长 cDNA 中找到 1 个完整的 ORF 结构,其推导的编码蛋白 EOLA1 一级结构由 158 个氨基酸组成(图 4)。经同源性检

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 医学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号