关于GO分析

上传人:jiups****uk12 文档编号:39261422 上传时间:2018-05-13 格式:DOC 页数:11 大小:75KB
返回 下载 相关 举报
关于GO分析_第1页
第1页 / 共11页
关于GO分析_第2页
第2页 / 共11页
关于GO分析_第3页
第3页 / 共11页
关于GO分析_第4页
第4页 / 共11页
关于GO分析_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《关于GO分析》由会员分享,可在线阅读,更多相关《关于GO分析(11页珍藏版)》请在金锄头文库上搜索。

1、【引用引用】关于关于 GO 分析分析 2011-07-13 17:19:27| 分类: 默认分类 | 标签: |字号大中小 订阅 Gene Ontology现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。这种情况归结为生物学上定义混乱的原因:不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人中蛋白质合成组分显著不同的。但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为“蛋白质合成类”,那么这无疑对于计算机

2、来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。这个项目最初是由 1988 年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库 Drosophila),t Saccharomyces Genome Database (酵母基因组数据库 SGD) and the Mouse Genome Database (小鼠基因组数据库 MGD)。从那开始,GO 不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。GO 的定义法则已经在多个合作的数据库中使用,这使在这些数据

3、库中的查询具有极高的一致性。这种定义语言具有多重结构,因此在各种程度上都能进行查询。举例来说,GO 可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物地受体酪氨酸激酶。这种结构允许在各种水平添加对此基因产物特性的认识。GO 发展了具有三级结构的标准语言(ontologies),如表所示。根据基因产物的相关分子功能,生物学途径,细胞学组件而给予定义,无物种相关性。本体论 内容 分子功能本体论 基因产物个体的功能,如与碳水化合物结合或 ATP 水解酶活性等 生物学途径本体论 分子功能的有序组合,达成更广的生物功能,如有丝分裂或嘌呤代谢等 细胞组件本体论 亚细胞结构、位置

4、和大分子复合物,如核仁、端粒和识别起始的复合物等 基本来说,GO 工作可分为三个不同的部分:第一,给予和维持定义;第二,将位于不同数据库中的本体论语言、基因和基因产物进行联系,形成网络;第三,发展相关工具,使本体论的标准语言的产生和维持更为便捷。本体论(The ontologies)GO 的结构包括三个方面?D?D 分子生物学上的功能、生物学途径和在细胞中的组件作用。当然,它们可能在每一个方面都有多种性质。如细胞色素 C,在分子功能上体现为电子传递活性,在生物学途径中与氧化磷酸化和细胞凋亡有关,在细胞中存在于线粒体质中和线粒体内膜上。下面,将进一步的分别说明 GO的具体定义情况。 基因产物基因

5、产物和其生物功能常常被我们混淆。例如,“乙醇脱氢酶”既可以指放在 Eppendorf 管里的基因产物,也表明了它的功能。但是这之间其实是存在差别的?D?D 一个基因产物可以拥有多种分子功能,多种基因产物也可以行使同一种分子功能。比如还是“乙醇脱氢酶”,其实多种基因产物都具有这种功能,而并不是所有的这些酶都是由乙醇脱氢酶基因编码的。一个基因产物可以同时具有“乙醇脱氢酶”和“乙醛歧化酶”两种功能,甚至更多。所以,在 GO 中,很重要的一点在于,当使用“乙醇脱氢酶活性”这种术语时,所指的是功能,并不是基因产物。许多基因产物会形成复合物后执行功能。这些“基因复合物”有些非常简单(如血红蛋白由血红蛋白基

6、因产物 球蛋白、球蛋白和小分子的亚血红素组成),有些非常复杂(如核糖体)。现在,小分子的描述还没有包括在 GO 中。在未来,这个问题可望由和现在的 Klotho 和 LIGAND 等小分子数据库联合而解决。分子功能分子功能描述在分子生物学上的活性,如催化活性或结合活性。GO 分子功能定义功能而不是整体分子,而且不特异性地指出这些功能具体的时空信息。分子功能大部分指的是单个基因产物的功能,还有一小部分是此基因产物形成的复合物的功能。定义功能的义项包括催化活性、转运活性、结合活性等,更为狭窄的定义包括腺苷酸环化酶活性或钟形受体结合活性等。 生物学途径生物学途径是由分子功能有序地组成的,具有多个步骤

7、的一个过程。举例来说,较为宽泛的是细胞生长和维持、信号传导。一些更为具体的例子包括嘧啶代谢或 配糖基的运输等。一个生物学途径并不是完全和一条生物学通路相等。因此,GO 并不涉及到通路中复杂的机制和所依赖的因素。 细胞组件细胞中的位置指基因产物位于何种细胞器或基因产物组中(如糙面内质网,核或核糖体,蛋白酶体等)。GO 的形式GO 定义的术语有着直接非循环式(directed acyclic graphs (DAGs)的特点,而并非是传统的等级制(hierarchy)定义方式(随着代数增加,下一级比上一级更为具体)。举个例子来说,生物学途径中有一个定义是己糖合成,它的上一级为己糖代谢和单糖合成。当

8、某个基因被注解为“己糖合成活性”后,它自动地获得了己糖代谢和单糖合成地注解。因为在 GO 中,每个术语必须遵循“真途径“法则,即如果下一代的术语可以用于描述此基因产物,其上一代术语也可以适用。GO 的注释(Annotation)那么,GO 中的术语如何和相对应的基因产物相联系的呢?这是由参与合作的数据库来完成的,它们使用GO 的定义方法,对它们所包含的基因产物进行注解,并且提供支持这种注解的参考和证据。每个基因或基因产物都会有一个列表,列出与之相关的 GO 术语。每个数据库都会给出这些基因产物和 GO 术语的联系数据库,并且也可以在 GO 的 ftp 站点上和 WEB 方式查询到。 并且,GO

9、 联合会提供了简化的本体论术语(GO slim),这样,可以在更高级的层面上研究基因组的功能。比如,粗略地估计哪一部分的基因组与信号传导、代谢合成或复制有关。 GO 对基因和蛋白的注释阐明了基因产物和用于定义他们的 GO 术语之间的关系。基因产物指一个基因编码的 RNA 或蛋白产物。因为一个基因可能编码多个具有很不相同性质的产物,所以 GO 推荐的注释是针对基因产物的而不是基因的。一个基因是和所有适用于它的术语联系在一起的。一个基因产物可以被一种本体论定义的多种分支或多种水平注释。注释需要反映在正常情况下此基因产物的功能,生物途径,定位等,而并不包括其在突变或病理状态下的情况。GO 联合会的各

10、个数据库成员采用手动或自动的方式生成注释,这两种方式共有的原理是:一.所有的注释都需要有来源,可以是文字、另一个数据库或是计算机分析结果;二.注释必须提供支持这种基因产物和 GO 术语之间联系的证据。GO 文件格式GO 的所有数据都是免费获得的。GO 数据有三种格式:flat(每日更新)、XML(每月更新)和MySQL(每月更新)。 这些数据格式都可以在 GO ftp 的站点上下载。XML 和 MySQL 文件是被储存于独立的 GO 数据库中。如果需要找到与某一个 GO 术语相关的基因或基因产物,可以找到一个相应表格,搜寻到这种注解的编号,并且可以链接到与之对应的位于不同数据库的基因相关文件。

11、GO 浏览器和修改器(browser and editor)GO 术语和注释使用了多种不同的工具软件,它们都可以在 web 方式的“GO 浏览器”下“GO software page”中找到。大多数 GO 浏览器都是 web 模式的,允许你直观的看到术语和其相关信息,如定义、同义词和数据库参考等。有些 GO 浏览器如 AmiGO 和 QuickGO,可以看到每个术语的注释。而可下载的DAG-Edit 编辑器,一样可以离线地显示注释和所有本体论定义的信息。对于每一个浏览器来说,都可以选择最适用于你要求的工具软件。 常见的三种浏览器AmiGO from BDGP 在 AmiGO 中,可以通过查询一

12、个 GO 术语而得到所有具有这个注释的基因产物,或查询一个基因产物而得到它所有的注释关系。还可以浏览本体论,得到术语之间的关系和术语对应的基因产物数目。AmiGO 直接连接 GO 下的 MySQL。 MGI GO Browser MGI GO 的功能类似于 AmiGO,所不同的在于它所得到的基因为小鼠基因。MGI GO 浏览器直接连接 GO 下的 MGI 数据库。 QuickGO at EBI QuickGO,整合在 EBI 下的 InterPro 中,可以通过查询一个 GO 术语而得到它的定义与关系描述、在 SWISS-PROT 中的定位、在酶分类学(EC)和转运分类学(TC)中的定位和 I

13、nterPro 中的定位等。 其他还有一些特殊的浏览 GO 的浏览器,其中括号中为建立机构和主要特色:EP GO Browser(EBI,基因表达情况),、GoFish (Harvard,Boolean 查询、GenNav(NLM, 图像化展示)、GeneOntologyRZPD (RZPD,UniGene)、ProToGO (Hebrew University,GO 的亚图像化)、CGAP GO Browser (癌症基因组解剖工程,癌症)、GOBrowser (Illuminae,perl.、TAIR Keyword Browser (TAIR,拟南芥)、PANDORA (Hebrew U

14、niversity,非一致化蛋白)。修改器GO 术语和本体论结构可以由任何可以读入 GO 平板文件的文本修改器进行编辑,但是这需要对平板文件非常熟悉。因此,DAG-Edit 是被推荐使用的,它是为 GO 特别设计的,能够保证文件的句法正确。GO注释可以被多种数据库特异性的工具所编辑,如 TIGR 的 Manatee 和 EBI 的 Talisman tool。但是 GO 数据库中写入新的注释是需要通过 GO 认证的管理员方可进行的,如果想提出新的注释或对本体论的建议,可以联系 GO。主要修改器为 DAG-Edit 和 COBrA。DAG-Edit 基于 Java 语言,提供了能浏览、查询、编辑

15、具有 DAG 数据格式的 GO 数据界面。在 SourceForge 可以免费下载,伴随着帮助文件。COBrA 能够编辑和定位 GO和 OBO 本体论。它一次显示两个本体论,因此可以在不同的水平相应定位。(如组织和细胞类型水平)优点在于可以综合几种本体论,支持的文件格式多,包括 GO 平板文件、GO RDF 和 OWL 格式等。如图为 DAG-Edit 的界面,可以分为四个部分:1) 定义编辑面板(term editor panel)显示当下的本体论。也是主要的编辑本体论结构的工具,可以通过点击和拖动术语来修改本体论的从属关系。2) 文本编辑面板(text editor panel)修改术语中

16、的内容。在修改多个术语时,会出现一个选择菜单,可以选中后逐个修改。 3) DAG 浏览器DAG 浏览器是一个插件,能够以图形的方式展示具有复杂的从属关系的术语。 4) 搜寻/屏蔽面板可搜寻术语、术语类型和术语间关系。可自定义屏蔽条件,限制得出的搜寻结果。GO 数据库的查找和浏览 FAQ1. 如何搜寻注释?使用 AmiGO 浏览器,可以在所有参与的数据库中搜寻一个特定的注解。AmiGO 允许使用 GO 术语或基因产物的搜寻。搜寻结果包括 GO 对这个术语的等级分级情况,定义和近义结构,外部链接,所有相联系的基因产物和它的下一级术语。2. 如何得到全部的 GO 注释?在 GO 网站上,基因产物与 GO 联系的组信息都有提供。这些文件储存了基因/基因产物的 ID 和引用文献等支持证据(如 FlyBase 基因 ID, SWISS-PROT 蛋白 ID),在 ftp 站点上都可以获得。3 在一些模式生物中,一个基因通常有多个与之相关的核苷酸序列,如 EST、蛋白序列等。要查询到这些序列,可以从该模式生物数据库中通过基因联系(gene association)查询到基因

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号