迎接21世纪生命科学的基因组与蛋白组计划时代

上传人:飞*** 文档编号:35689486 上传时间:2018-03-19 格式:DOC 页数:4 大小:293.34KB
返回 下载 相关 举报
迎接21世纪生命科学的基因组与蛋白组计划时代_第1页
第1页 / 共4页
迎接21世纪生命科学的基因组与蛋白组计划时代_第2页
第2页 / 共4页
迎接21世纪生命科学的基因组与蛋白组计划时代_第3页
第3页 / 共4页
迎接21世纪生命科学的基因组与蛋白组计划时代_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《迎接21世纪生命科学的基因组与蛋白组计划时代》由会员分享,可在线阅读,更多相关《迎接21世纪生命科学的基因组与蛋白组计划时代(4页珍藏版)》请在金锄头文库上搜索。

1、迎接 21 世纪生命科学的新时代 基因组与蛋白组计划时代湖南医科大学分子生物学研究中心研究生 (长沙 410078)谭文斌 朱定尔专业导师当全世界人类基因组计划在近年取得迅速和突出的进展 ,即将来临的 21 世纪将带领人类基因组计 划进入一个后基因组时代 、 蛋白组计划 、 生物信息学的新时代 ,所有这些将构成 21 世纪生命科学研究的核心前沿和主流 。同样 ,生物信息学的成果将高度地拓展生命科学新的研究领域和加速其研究的进程 。多种多样数以千万计的生命模式 (如生物大分子结构功能的模式) 的数字化 ,将是加快生命科学信息化 步入一个崭新的水平和时代的必由之路 。 关键词 :人类基因组计划 后

2、基因组时代 蛋白组计划 生物信息学21 世 纪 是 生 命 科 学 、 信 息 科 学 的 世纪 ,也必将是生命科学与信息科学融合交 汇发展的世纪 。以系统论的眼光来看 , 21 世纪的生命科学将由人类基因组计划和后 基因组时代 、 蛋白组计划 、 生物信息学 、 生命科学模式数字化等部分组成 。本文将就21 世纪生命科学在这几方面的发展趋势 作一简要描述 。一 、 人类基因组计划和后基因组时代人类基因组是指合成有功能的人体各 类细胞中蛋白质及/ 或多肽链和 RNA 所必需的全部 DNA 顺序和结构 。也即包含人类的 24 条染色体 ( 22 条常染色体和 X 、Y两条性染色体) 上全部 DN

3、A 所携带的遗传 信息的总和 ,其总长度约为 3 109 bp ,估约含 810 万个基因 。人类基因组计划 ( Hu2man Geno me Project , H GP) 旨 在 阐 明 人 类 基因组的全部序列 ,从整体上破译人类遗 传信息 ,使人类第一次在分子水平上全面 地认识自我 。主要包括四项任务 : ( 1) 遗传 图谱的建立 ; (2) 物理图谱的建立 ; (3) DNA顺序测定 ; ( 4) 基因的 识 别 。美 国 于 1990 年正式启动 H GP , 15 年时间内提供 30 亿 美元的资助 。现预计整个基因组测序工作将于 2005 年之前完成 。1当基因数据库逐渐地被

4、填充时 , 下一 步便是 要 研 究 这 些 基 因 到 底 有 怎 样 的 功 能 , 这 就 是 后 基 因 组 时 代 ( Po st geno me Era) 2 的到来 。810 万个基因的功能研 究比 H GP 更为复杂和艰巨 ,必将成为下个 世纪生命科学研究的主战场 。其主要任务 有 :11 研究组织器官特异 性 的 基 因 表 达 : 迄今发展起来的基因表达系列分析法 ( Se2 rial Analysis of Gene Exp ressio n , SA GE) 和 微排列分析法 ( Microarray assay) 可同时对 上千种基因的表达进行研究 。预计这两种 方法

5、将 成 为 今 后 研 究 基 因 表 达 的 主 要 手段 。2 ,321 基因表达与调控研究 。基因表达除组织特异性外 ,还有发育阶段特异性等方面精确调控 。近来的研究表明 , 基因 的表达调控不能简单地认为是几个反式作用因子 和 顺 式 作 用 元 件 间 有 序 地 相 互 作方法 ,创立新的方法 , 在现有研究基础上 ,从而认识生命的本质 遗传信息的传递 利用数学 、 统计学 、 信息学的研究成就 , 对 基因表达调控的可能模式在理论上进行预 测 。31 基因组 95 %左右的 “废弃”DNA 信 息的运作规律尚未有突破性认识 , 这些非编码区 DNA 是否为调控序列或为有其它 作用

6、的序列 ? 又是如何发挥其功能的 ? 这 些问题与基因的表达调控有部分的重叠 , 期待着科学家去研究 。41 基因诊断 、 基因 治疗和基因工程产品开发将展现出广阔的应用前景 ,将引发临床诊断和治疗以及医 药工业的变革 。 人类基因组计划和后基因组时代研究 任务是异常复杂和艰巨的 ,以人类基因组 计划为例 ,如果每个实验室克隆一个新的基因 ,欲完成人类整个基因组的克隆则需8 10 万个实验室 ; 再加上各个实验室间 条件 、 人员素质不一以及实验室之间的重 复竞争等不利因素对完成克隆整个人类基 因组显然不知要到何年何月 。然而 , 我们若将人类 8 10 万个基因视为一个整体 , 从整体水平上

7、去考察基因的存在 、 基因的 结构与功能 、 基因之间的相互关系 ,即用系 统论的方法进行研究 ,对整个计划系统的 组织实施 ,也可能迎刃而解 。因此 ,人类基因组计划的实施是系统论方法在生命科学 中的典型运用 。同时也说明了当代科学研 究模式从以往的自由 、 盲目 、 独立 、 小规模 走向社 会 化 、 整 体 化 、 系 统 化 、 大 规 模 化 。 我们期望着这一哲学的方法能在后基因组时代和 蛋 白 组 计 划 研 究 中 发 挥 更 大 的 作或基因的本质 ; 随着人们对核酸的研究越 来越深刻和全面 ,人们认识到单纯孤立的 核酸研究已不能完全解决生命现象的本质 问题 ,只有同时结合

8、对核酸和蛋白质的研究 ;并且只有在研究核酸的基础上才能在 本质上对蛋白质进行认识 。于是生物化学 家和分 子 生 物 学 家 经 历 了 从 蛋 白 质 核 酸 ,最终又回到蛋白质和核酸结合的研究 历程 。随着人类基因组计划的完成和后基因组时代的到来 , 一个新的研究领域 蛋白组 ( Proteo me) 的研究随之提出了 。如 果我们将人体整个蛋白质称为蛋白组 , 那么蛋白质组无疑是一个极为复杂的群体 。 阐明蛋白质的结构和功能是揭示生命奥秘 的另一关键所在 。然而 , 我们现在对蛋白质的 研 究 困 难 重 重 , 还 缺 乏 有 效 的 方 法 。 当 Pat rickoFarrell

9、发明了 双 向 凝 胶 电 泳( t wo dimensio nal gel elect rop ho resis , 2D gel elect rop ho resis) 后 ,人们曾为之鼓舞 。但到 了 80 年代中期 ,人们发现这种方法有两个 弱点 : (1) 难以重复 ,以致不同实验室间无 法比较 ; (2) 很难从蛋白质图片斑点中获得 信息 。近 来 新 的 质 谱 测 定 法 ( mass spec2 t ro met ry ,M S) 诞生后 ,两种基本技术 : 激光 脱吸附质谱测定法 (laser deso rp tio n M S) 以 及电喷雾质谱测定法 ( elect r

10、o sp ray M S) 分 别得已发展 ,人们开始叩开了大规模 、 自动 化蛋白质图片斑点识别之门 , 但这种方法 仍有待于进一步的改进和发展 。4蛋白质空间结构预测是蛋白组计划的们推测地球上存在的蛋白质有 1040 之多 , 从 50 年代第一个蛋白质 肌球蛋白的 空间结构被测定至今已有 40 年历史 ,但总 计被测定的蛋白质结构只有 6 000 余个 。 因此 ,要想用实验的方法测定所有蛋白质的空间结构是不可能的事情 。解决这一问 题的有效途径似乎只有从理论上发展预测 蛋白质结构的新方法 。这些方法的基本思 维是将基于知识的方法与计量化学 、 统计 物理学 、 信息学的方法相结合起来

11、,从理论上预测蛋白质的空间结构 。5 一旦这些方 法取得成功 ,蛋白质折叠这一分子生物学 难题将有望获得解决 ,同时也为分子生物 学研究提供新的思路 。三 、 生物信息学 从哲 学 高 度 而 言 , 21 世 纪 是 生 命 科 学 、 信息科学的世纪 ,也必将是生命科学与 信息科学融合交汇发展的世纪 。两者的融 合交汇便诞生出一门崭新的学科 生物 信息学 。因此生物信息学是基于生物学与 数学 、 物理学 、 化学以及计算机科学等诸多 学科交叉发展而成 ,是随着基因组测序数 据迅猛增加而逐渐兴起 。其核心是基因组 信息 学 , 它 包 含 着 基 因 组 信 息 的 获 取 、 处 理 、

12、存储 、 分配和解释 。6 迄今 ,国际上四个 大的生物信息中心即美国国家生物技术信 息中心 ( N CB I) 和基因组序列数据库 ( GS2DB) 、 欧洲分子生物学实验室 ( EMBL ) 和日 本 DNA 数据库 (DDBJ ) 已建立和维持了源 自数百种生物的 cDNA 和基因组 DNA 序列的大型数据库 。基因组相关数据库及计 算机网络技术的高速发达 ,使世界各国的 科学家 均 能 及 时 得 到 所 需 要 的 数 据 与 资 料 。7 生物信息学的发展 ,极大地促进了分 子生物学的研究 ,开拓了一些新的研究领域 ,诞生了一些新的研究方法 ,例如对齐比 较研究法 、 分子进化论

13、、 蛋白质空间结构预 测 、DNA 大规模序列分析 等 。又 例 如 , 为 了解决双向电泳凝胶上的蛋白质斑点识别的难题 , Genevas Ro n Appel 发 明 了 一 种 叫 Melanie 的软件包以对凝胶图像进行 比较 。在 此 基 础 上 , 生 物 信 息 学 家 Amo s Bairoch 和 Appel 随后发展了一种蛋白质专 业分 析 系 统 ( t he Expert Protein AnalysisSystem , Ex PA Sy) ,该系统将 Geneva 2D gel 数据库与 SW ISS - PRO T 蛋白质序列数据库联网 ,再与其它的数据与软件工具联

14、网 。 每月 这 套 系 统 能 从 WWW ( wo rld wideweb) 收到 300 000 份分析 2D gel 蛋白斑点 的请求 ,同时也帮助研究者从蛋白质序列预测其功能 ,从而开始了大规模 、 自动化蛋 白质的分析 。4由于生物信息学的发展和人类基因组 计划的完成 ,人们对现在医学的认识将有彻底的改变 今后人们去看医生时 , 很 可能是带着存有自己遗传密码的光盘 , 请 医生帮 助 从 中 找 到 最 佳 的 诊 断 和 治 疗 方 案 。四 、 生命科学模式数字化 科学要数字化 ,生命科学亦是如此 ,建 立数学模型来描述生命现象的本质和规律 将是分子生物学今后发展的方向之一

15、。我 们姑且看看生命现象中的数学 : 首先看看 DNA ,它由 A 、T 、G、C 四种碱基构成 ,不正 是数学中的四进制吗 ? 若以 A 、T 、G、C 配 对的方式 A - T 、G - C 而言 , 就是计算机 中采用的二进制了 ,再看看蛋白质和多肽 , 由 20 种氨基酸构成 ,其一级结构无非是 1 至 20 进制中的任何一种 ,在此基础上再加 以组 合 , 便 构 成 蛋 白 质 的 庞 大 家 族 ; 在 DNA 的复制 、 转录及蛋白质的合成中都体 现了数学运算的规则 。又如蛋白质活化与失活过程中的磷酸化 、 去磷酸化 、 乙酰化 、 去乙酰化等修饰方式无不体现了二进制 。再加上

16、 DNA 双螺旋结构和肽键平面简洁 的数学模型 。由此可见 , 生命活动的本质 规则体现了最简单的数学法则 , 这也就是 生命科学数字化的基础 。参考文献基因的表达与调控和蛋白质结构与功能 : 1 . 陈 竺. 人类基因组 , 合作大舞台. 第 3 版. 中国 科学报 ,1998 年 1 月 7 日 ,第 1192 期2 . Rachel Nowak . Entering t he Po st geno me Era . Sci2ence ,1995 ,270 :3683 . Victo r E. Velculescu et al . Serial Analysis of GeneExp ressio n . Scienc

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号