《代谢组学-详细(精制医学)》由会员分享,可在线阅读,更多相关《代谢组学-详细(精制医学)(45页珍藏版)》请在金锄头文库上搜索。
1、代谢组学代谢组学- -方法与应用方法与应用 授课教师授课教师 :吴敬:吴敬 教授教授 授课时间:授课时间:2009年年11月月1精制类 “基因组学反映了什么是可以发生的,转录基因组学反映了什么是可以发生的,转录组学反映的是将要发生的,蛋白质组学指出了组学反映的是将要发生的,蛋白质组学指出了赖以发生的,只有代谢组学才真正反映业已发赖以发生的,只有代谢组学才真正反映业已发生的。生的。” 许国旺许国旺2精制类第一章第一章 代谢组学的简介代谢组学的简介 第二章第二章 代谢组学的研究方法代谢组学的研究方法第四章第四章 代谢组学的应用代谢组学的应用第五章第五章 代谢组学的发展前景代谢组学的发展前景 3精制
2、类组学时代组学时代4 4种最重要的组学种最重要的组学4精制类代谢组学代谢组学(Metabonomics/ Metabolomics Metabonomics/ Metabolomics )是通过考察生)是通过考察生物体系(细胞、组织物体系(细胞、组织 或生物体)受刺激或扰动后(如将某或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学。随时间的变化,来研究生物体系的一门科学。代谢组代谢组(metabolomemetabolome)是基因组的下游产物也是最终产物,)是基因组的
3、下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常生长功能是一些参与生物体新陈代谢、维持生物体正常生长功能 和和生长发育的小分子化合物的集合,主要是相对分子量小于生长发育的小分子化合物的集合,主要是相对分子量小于10001000的内源性小分子。的内源性小分子。代谢物数量因物种不同而差异较大:代谢物数量因物种不同而差异较大:植物(植物(200 000200 000种)、动物(种)、动物(25002500种)、微生物(种)、微生物(15001500种)种)5精制类 代谢组学是继基因组学和蛋白质组学之后新近发展代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要
4、组成部分。起来的一门学科,是系统生物学的重要组成部分。 基因组学和蛋白质组学分别从基因和蛋白质层面探基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是发生在寻生命的活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放(代谢物层面的,如细胞信号释放(cell signalingcell signaling),),能量传递,细胞间通信等都是受代谢物调控的。代谢组能量传递,细胞间通信等都是受代谢物调控的。代谢组学正是研究代谢组(学正是研究代谢组(metabolomemetabolome)在某一时刻细胞在某一时刻细胞内所有代谢物的集合内所有代谢物的集
5、合的一门学科。基因与蛋白质的的一门学科。基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态,药物和环境污染物的作用,境,这又与细胞的营养状态,药物和环境污染物的作用,以及其它外界因素的影响密切相关。以及其它外界因素的影响密切相关。 因此有人认为,因此有人认为,“基因组学和蛋白质组学告诉你什基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了。么可能会发生,而代谢组学则告诉你什么确实发生了。”(Bill Lasley, UC DavisBill Lasley, UC Davis)6精制类19
6、8219831984198919992000200120022004Van De GreefVan De Greef: publication of MS for urine profilingSadler, Buckingham and Nicholson:Sadler, Buckingham and Nicholson: First publication on 1H-NMR of blood and plasmaNicholson, et al.: Nicholson, et al.: Multi-component analysis of spectra data from rat u
7、rineNicholson and Wilson: NMR spectroscopy of biofluidsNicholson: Nicholson: Definition of MetabonomicsHaselden, et al.:Haselden, et al.: First independent Pharma publication of MetabonomicsNicholson, Lindon, and Holmes:Nicholson, Lindon, and Holmes: Publication in Nature on MetabonomicsHolmes and A
8、ntti Holmes and Antti Explanation of statistics in MetabonomicsIncreasing # of publicationsIncreasing # of publications第一章第一章 代谢组学简介代谢组学简介代谢组学的发展代谢组学的发展7精制类代谢组学的特点:代谢组学的特点:1.1.关注内源化合物关注内源化合物2.2.对生物体系的小分子化合物进行定量定性研究对生物体系的小分子化合物进行定量定性研究3.3.上述化合物的上调和下调指示了与疾病、毒性、基因上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响修饰或环境因
9、子的影响4.4.上述内源性化合物的知识可以被用于疾病的诊断和药上述内源性化合物的知识可以被用于疾病的诊断和药物筛选物筛选与转录组学和蛋白组学相比,代谢组学有以下优点:与转录组学和蛋白组学相比,代谢组学有以下优点:1.1.基因与蛋白质表达的微小变化会在代谢物上得到放大,基因与蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易从而使检测更容易2.2.代谢组学的研究不需要建立全基因测序及大量序列标代谢组学的研究不需要建立全基因测序及大量序列标签(签(ESTEST)的数据库)的数据库3.3.代谢物的研究种类远小于蛋白质的数目代谢物的研究种类远小于蛋白质的数目4.4.研究中采用的技术更通用研究中
10、采用的技术更通用8精制类 Genomics and Proteomics are not sufficient to describe reasons for toxicity or disease state 基因组学和蛋白组学对于毒性或疾病状态的描述是不足的基因组学和蛋白组学对于毒性或疾病状态的描述是不足的 Neither Genomics nor Proteomics can produce time course information which is important for animal to animal comparison 基因组学和蛋白组学都不能提供动态信息,但这些信息
11、对于动物间的比较是重要的基因组学和蛋白组学都不能提供动态信息,但这些信息对于动物间的比较是重要的 Metabolite profiling produces information on the biochemical pathways effected 代谢物分析能提供生化途径结果的信息代谢物分析能提供生化途径结果的信息 Monitoring metabolites allows concurrent or sequential affects to be monitored, e.g. blocking of a metabolic pathway in the liver can lea
12、d to toxicity in the brain (hydrazine) 代谢监控可监控即时或相继的结果,例如:阻断肝脏中代谢途径会在脑中产生毒性肼代谢监控可监控即时或相继的结果,例如:阻断肝脏中代谢途径会在脑中产生毒性肼 Metabonomics, unlike the other “omics” is non-invasive 不像别的组学研究,代谢组学是无创的不像别的组学研究,代谢组学是无创的The Need for Metabonomic Information9精制类代谢组学研究现状代谢组学研究现状 代谢组学属于代谢组学属于全局系统生物学(全局系统生物学(Global syste
13、ms Global systems biologybiology)研究方法,便于对复杂体系的整体进行认识研究方法,便于对复杂体系的整体进行认识譬如,一个正常工作的人体包括譬如,一个正常工作的人体包括“人体人体”本身和与本身和与之共同进化而来且共生的消化道微生物群体(或称菌之共同进化而来且共生的消化道微生物群体(或称菌群),孤立地研究群),孤立地研究“人体人体”本身的基因,转录子以及本身的基因,转录子以及蛋白质当然可以为人们认识人体生物学提供重要信息,蛋白质当然可以为人们认识人体生物学提供重要信息,但无法提供使人体正常工作不可缺少的菌群的信息但无法提供使人体正常工作不可缺少的菌群的信息人体血液和
14、尿液的代谢组却携带着包括菌群在内的每人体血液和尿液的代谢组却携带着包括菌群在内的每一个细胞的信息,因此代谢组学方法对研究如人体这一个细胞的信息,因此代谢组学方法对研究如人体这样复杂的进化杂合体十分有效样复杂的进化杂合体十分有效10精制类不同器官不同器官组织具有不同的代具有不同的代谢轮廓,广廓,广谱全采集全采集11精制类 代谢组学已经广泛地应用到了包括药物研发代谢组学已经广泛地应用到了包括药物研发, ,分子生理学分子生理学, ,分子病理分子病理学学, ,基因功能组学基因功能组学, ,营养学营养学, ,环境科学等重要环境科学等重要领域领域. .在代谢组学诞生后的在代谢组学诞生后的6 6年里年里,
15、,有关代谢组学的研究论文和专利以指数的形式逐年增长有关代谢组学的研究论文和专利以指数的形式逐年增长. .12精制类 代谢组学与系统生物学代谢组学与系统生物学 系统生物学概念的诞生系统生物学概念的诞生标志标志着研究哲学由着研究哲学由 还原论还原论 向向 整体论整体论 的变化的变化. .系统生物学的中心任务就是要针对生物系系统生物学的中心任务就是要针对生物系统整体统整体( (无论它是生物细胞无论它是生物细胞, ,多细胞组织多细胞组织, ,器官还是生物整体器官还是生物整体),),建立定量建立定量, ,普适普适, ,整体和可预测整体和可预测(QUIP)(QUIP)的认知的认知. . 具体而言具体而言,
16、 ,系统生物学研究就是要将给定生物系统的基系统生物学研究就是要将给定生物系统的基因因, ,转录转录, ,蛋白质和代谢水平所发生的事件蛋白质和代谢水平所发生的事件, ,相关性及其对所相关性及其对所涉及生物过程的意义进行整体性认识,从而出现了许多的涉及生物过程的意义进行整体性认识,从而出现了许多的 组组 和和 组学组学 的新概念的新概念. .13精制类 现已提出的一百多个现已提出的一百多个 组组 和和 组学组学,可以大体归纳为可以大体归纳为 基因组基因组/基因组学基因组学,转录组转录组/转录组学转录组学,蛋白质组蛋白质组/蛋白质组学蛋白质组学 和和 代谢组代谢组/代谢组学代谢组学 四四个方面个方面
17、. .显而易见显而易见,DNA,mRNA,DNA,mRNA以及蛋白质的存在为生物过程的发生提供了物质基以及蛋白质的存在为生物过程的发生提供了物质基础础( (但这个过程有可能不发生但这个过程有可能不发生!),!),而代谢物质所反映的是已经发生了的生物学事而代谢物质所反映的是已经发生了的生物学事件件. .因此代谢组学是对一个生物系统进行全面认识的不可缺少的一部分因此代谢组学是对一个生物系统进行全面认识的不可缺少的一部分, ,是全局是全局系统生物学系统生物学(global systems biology)(global systems biology)的重要基础的重要基础14精制类第二章第二章 微生
18、物代谢组学的研究方法微生物代谢组学的研究方法Challenges of MetabonomicsSample Complexity and Data HandlingEach sample has.,Each sample has., a wide range of compound classes a wide variation in metabolite concentrations a large number of potential componentsEach group of samples has,Each group of samples has,many sample a
19、nalyses are required for statistical relevancea complex raw dataset that needs to be processeddifferences between sample groups which need to be highlighted15精制类 代谢组学代谢组学(metabonomics(metabonomicsmetabolomics)metabolomics)是效仿是效仿基因组学和蛋白质组学的基因组学和蛋白质组学的研究思想研究思想,对生物体内所有,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化代谢物
20、进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。的相对关系的研究方式,是系统生物学的组成部分。 其其研究对象研究对象大都是相对分子质量大都是相对分子质量10001000以内的小分以内的小分子物质。先进分析检测技术结合模式识别和专家系统子物质。先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的等计算分析方法是代谢组学研究的基本方法基本方法。 16精制类 代谢组学代谢组学利用利用高通量、高灵敏度与高精确度的现代高通量、高灵敏度与高精确度的现代分析技术,分析技术,动态跟踪动态跟踪细胞、有机体分泌出来的体液中的细胞、有机体分泌出来的体液中的代谢物
21、的整体组成,代谢物的整体组成,借助借助多变量统计方法,来多变量统计方法,来辩识和解辩识和解析析被研究对象的生理、病理状态及其与环境因子、基因被研究对象的生理、病理状态及其与环境因子、基因组成等的关系。组成等的关系。 “代谢组学代谢组学”是一种整体性的是一种整体性的研究策略研究策略,其研究策,其研究策略有点类似于通过分析发动机的尾气成分,来研究发动略有点类似于通过分析发动机的尾气成分,来研究发动机的运行规律和故障诊断等的机的运行规律和故障诊断等的“反向工程学反向工程学”的技术思的技术思路。由于代谢组学着眼于把研究对象作为一个整体来观路。由于代谢组学着眼于把研究对象作为一个整体来观察和分析,也被称
22、为察和分析,也被称为“整体的系统生物学整体的系统生物学”。 17精制类研究方法和步骤研究方法和步骤1.1.样品制备:足量的代表性样品(样品制备:足量的代表性样品(-80-80保存)保存)2.2.数据采集和标志物识别:常用色谱数据采集和标志物识别:常用色谱- -质谱联用质谱联用 、NMRNMR3.3.数据分析:数据分析: PCAPCA、 PLSPLS、 ANNANN4.4.代谢途径分析:代谢轮廓分析和代谢组学分析代谢途径分析:代谢轮廓分析和代谢组学分析18精制类The strategy for large scale metabonomics research19精制类样品制备样品制备 微生物代
23、谢物样品的制备一般分为微生物培养、淬灭和微生物代谢物样品的制备一般分为微生物培养、淬灭和代谢产物的提取。根据研究对象、目的和采用的分析技术不代谢产物的提取。根据研究对象、目的和采用的分析技术不同同, ,所需的样品提取和预处理方法各异,不存在一种普适性所需的样品提取和预处理方法各异,不存在一种普适性的标准化方法。的标准化方法。 微生物代谢组学研究要求微生物的生长条件是可以控制微生物代谢组学研究要求微生物的生长条件是可以控制和重复的。在一个生物反应器中,需要严格控制温度、和重复的。在一个生物反应器中,需要严格控制温度、pHpH、培养基组成、溶解氧和二氧化碳等以明确界定生长条件,建培养基组成、溶解氧
24、和二氧化碳等以明确界定生长条件,建立标准的和可重复的参考培养条件。微生物的培养可以以分立标准的和可重复的参考培养条件。微生物的培养可以以分批、补料或者连续培养模式进行。由于连续培养的菌体生理批、补料或者连续培养模式进行。由于连续培养的菌体生理稳定,易于控制且重现性较好,所以,大多数研究者倾向于稳定,易于控制且重现性较好,所以,大多数研究者倾向于应用生物反应器连续培养操作模式。应用生物反应器连续培养操作模式。 20精制类在样品淬灭和代谢物的提取过程中,应遵循的原则是:在样品淬灭和代谢物的提取过程中,应遵循的原则是:(1 1)淬灭工艺最好可以立即冻结细胞代谢)淬灭工艺最好可以立即冻结细胞代谢(2
25、2)在淬灭过程中要求细胞膜无明显损伤,以免胞内代)在淬灭过程中要求细胞膜无明显损伤,以免胞内代谢物外泄。谢物外泄。(3 3)提取过程中应该尽可能多的提取胞内代谢物。)提取过程中应该尽可能多的提取胞内代谢物。(4 4)代谢产物不应该遇到任何物理或化学修饰。)代谢产物不应该遇到任何物理或化学修饰。(5 5)得到的样品基质应与所选择的分析方法相容。)得到的样品基质应与所选择的分析方法相容。 冷甲醇、液氮和热乙醇是最常用的淬灭方法,而在冷甲醇、液氮和热乙醇是最常用的淬灭方法,而在提取方面由于特定的提取条件往往仅适合某些类化合物提取方面由于特定的提取条件往往仅适合某些类化合物目前尚无一种能够适合所有代谢
26、产物的提取方法应该根目前尚无一种能够适合所有代谢产物的提取方法应该根据不同的化合物选择不同的提取方法,并对提取条件进据不同的化合物选择不同的提取方法,并对提取条件进行优化。行优化。 21精制类 对获得的样品中所有代谢物进行分析鉴定是代谢组学对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤,也是最困难和多变的步骤。研究的关键步骤,也是最困难和多变的步骤。 与原有的各种组学技术只分析特定类型的物质不同,与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对象的大小、数量、官能团、挥发性、带电代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差
27、异很大,要性、电迁移率、极性以及其他物理化学参数差异很大,要对它们进行无偏向的全面分析,单一的分离分析手段往往对它们进行无偏向的全面分析,单一的分离分析手段往往难以保证。难以保证。 色谱、质谱、核磁共振、红外光谱、库仑分析、紫外色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于代谢组学的研究。其组合都被应用于代谢组学的研究。 22精制类23精制类 一般来说一般来说, ,选择代谢物组学分析方法时选择代谢物组学分析方法时, ,其原则是要其原则是要同时考虑仪器和技术的检测速度、选择性和灵敏
28、度同时考虑仪器和技术的检测速度、选择性和灵敏度, ,找找到一种最适合目标化合物的方法。到一种最适合目标化合物的方法。 化学分析技术中最常用的是化学分析技术中最常用的是1 1H H核磁共振核磁共振( (1 1HNMR)HNMR)以及以及色谱质谱联用色谱质谱联用(X-MS)(X-MS),如气相色谱耦联质谱,如气相色谱耦联质谱(GC/MS)(GC/MS)、液相色谱耦联质谱液相色谱耦联质谱(LC/MS)(LC/MS)和毛细管电泳耦联质谱联用和毛细管电泳耦联质谱联用技术技术 (CE/MS)(CE/MS)来分析研究代谢物并为其绘制图谱。这些来分析研究代谢物并为其绘制图谱。这些技术的耦联可以提高对样品的分辨
29、率、敏感性及选择度技术的耦联可以提高对样品的分辨率、敏感性及选择度, ,有利于对更多的生物体系内的代谢物绘制图谱。有利于对更多的生物体系内的代谢物绘制图谱。24精制类 GC/MS GC/MS 、LC/MSLC/MS和和CE/MS CE/MS 可以同时检测出数百种化可以同时检测出数百种化合物,包括糖类、有机酸、氨基酸、脂肪酸和大量不同合物,包括糖类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物的次生代谢物 。 GC/MSGC/MS有很好的分离效率且相对较为经济,但需要有很好的分离效率且相对较为经济,但需要对样品进行衍生化预处理,这一步骤会耗费额外的时间,对样品进行衍生化预处理,这一步骤会耗费额外
30、的时间,甚至引起样品的变化。受此限制,甚至引起样品的变化。受此限制,GC/MS GC/MS 无法分析膜脂无法分析膜脂等热不稳定性的物质和分子量较大的代谢产物。等热不稳定性的物质和分子量较大的代谢产物。近来,多维分离技术如二级气相色谱飞行时间质谱近来,多维分离技术如二级气相色谱飞行时间质谱(GC-GC-TOF-MSGC-GC-TOF-MS),检测范围更广,但由于实际应用困),检测范围更广,但由于实际应用困难和花费较高等问题使其并未普遍使用。难和花费较高等问题使其并未普遍使用。 25精制类 HPLC HPLC 与与 GC GC 原理相似,但在进样前不需进行衍生原理相似,但在进样前不需进行衍生化处理
31、,适合那些不稳定、不易衍生化、不易挥发和分化处理,适合那些不稳定、不易衍生化、不易挥发和分子量较大的化合物。子量较大的化合物。HPLC/MS HPLC/MS 选择性和灵敏度都较好,选择性和灵敏度都较好,但分析的时间相对较长,且需依赖纯的参照物。但分析的时间相对较长,且需依赖纯的参照物。 CE-MSCE-MS分离样品效率比普通的色谱质谱联用要高得分离样品效率比普通的色谱质谱联用要高得多,仅需要极少的进液量多,仅需要极少的进液量nLnL),而且其测试时间短,试),而且其测试时间短,试剂成本低。剂成本低。CE-MSCE-MS在微生物代谢组领域发挥着越来越重在微生物代谢组领域发挥着越来越重要的作用。要
32、的作用。 色谱质谱连用技术具有分离效率高、灵敏度好及经色谱质谱连用技术具有分离效率高、灵敏度好及经济实用等优点。但需要解决的主要问题是:大量色谱峰济实用等优点。但需要解决的主要问题是:大量色谱峰的识别问题以及方法的重现性问题。的识别问题以及方法的重现性问题。26精制类NMRNMR是当前代谢组学研究中的主要技术是当前代谢组学研究中的主要技术 首先,不同于质谱具有离子化程度和基质干扰等问题,首先,不同于质谱具有离子化程度和基质干扰等问题,NMR NMR 没有偏向性,对所有化合物的灵敏度是一样的;其次,没有偏向性,对所有化合物的灵敏度是一样的;其次,NMR NMR 无损伤性,不破坏样品的结构和性质,
33、可在接近生理条无损伤性,不破坏样品的结构和性质,可在接近生理条件下进行实验,可在一定的温度和缓冲液范围内选择实验条件下进行实验,可在一定的温度和缓冲液范围内选择实验条件,可以进行实时和动态的检测;此外,件,可以进行实时和动态的检测;此外,NMR NMR 氢谱的谱峰与氢谱的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一样品中各化合物的氢原子是一一对应的,所测样品中的每一个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样品中各组分的相对含量,更为直观弱反映样品中各组分的相对含量,更为直观 。因此,。因此,NMR NMR 方法
34、很适合研究代谢产物中的复杂成分。方法很适合研究代谢产物中的复杂成分。 与与 GC/MS GC/MS 和和 LC/MS LC/MS 相比,相比, NMR NMR 的缺点是灵敏度低,的缺点是灵敏度低,有可能形成信号重叠,且其对样品制备的要求很高。同时因有可能形成信号重叠,且其对样品制备的要求很高。同时因为动态范围有限,很难同时测定生物体系中共存的浓度相差为动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物。较大的代谢产物。 27精制类数据分析平台数据分析平台 在代谢组学研究中,大多数是从检测到的代谢产物信在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类息中进行两类(如基因突
35、变前后的响应如基因突变前后的响应)或多类或多类(如不同表型如不同表型间代谢产物间代谢产物)的判别分类以及生物标记物的发现。由于生物的判别分类以及生物标记物的发现。由于生物样品的组成复杂,在得到分析对象的原始谱图后,首先需样品的组成复杂,在得到分析对象的原始谱图后,首先需要对数据进行预处理要对数据进行预处理(归一化和滤噪归一化和滤噪),消除干扰因素,保留,消除干扰因素,保留有用信息。有用信息。 数据的解析可分为如下数据的解析可分为如下3个基本步骤:个基本步骤:(1)提取出色谱分离后未能有效分开的代谢物峰并得出其相提取出色谱分离后未能有效分开的代谢物峰并得出其相应浓度;应浓度;(2)根据其保留时间
36、及质谱图等信息鉴别有效峰所代表的化根据其保留时间及质谱图等信息鉴别有效峰所代表的化合物;合物;(3)根据代谢数据建立代谢网络模型。根据代谢数据建立代谢网络模型。28精制类 代谢组学分析得到的是信息含量丰富的多维数据,应用代谢组学分析得到的是信息含量丰富的多维数据,应用模式识别和多维统计分析等方法能从这些大量的数据中充分模式识别和多维统计分析等方法能从这些大量的数据中充分挖掘出其中的信息,这些方法能够为数据降维,使它们更易挖掘出其中的信息,这些方法能够为数据降维,使它们更易于可视化和分类。于可视化和分类。 目前数据分析常用的两类算法是基于寻找模式的非监督目前数据分析常用的两类算法是基于寻找模式的
37、非监督方法方法 (unsupervised method) (unsupervised method) 和有监督方法和有监督方法 (supervised (supervised method)method)。 非监督方法非监督方法 是用来探索完全未知的数据特征的方法,对原是用来探索完全未知的数据特征的方法,对原始数据信息依据样本特性进行归类,把具有相似特征的目标始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里,并采用相应的可视化技术直观地表达数据归在同源的类里,并采用相应的可视化技术直观地表达出来。应用在此领域的常见方法有聚类分析出来。应用在此领域的常见方法有聚类分析 (
38、cluster (cluster analysis) analysis) 和主成分分析和主成分分析 (principal components (principal components analysisanalysis,PCA) PCA) 等。等。 29精制类 聚类分析聚类分析依据物以类聚的原理分析具有相似性的事依据物以类聚的原理分析具有相似性的事物,将分类对象置于一个多维空间中,根据事物彼此不同物,将分类对象置于一个多维空间中,根据事物彼此不同的属性进行辨认,将性质相近的归入一类,这样归在同一的属性进行辨认,将性质相近的归入一类,这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按其
39、相类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类,并找出每一类事物共同特征的分析工具。似程度进行分类,并找出每一类事物共同特征的分析工具。 具体到代谢组学中,被归入一类的物质有相同的特征,具体到代谢组学中,被归入一类的物质有相同的特征,可能有相同的功能作用,这样通过同一类事物中一个研究可能有相同的功能作用,这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用。聚较为清晰的物质可以推断该类中其他物质的功能作用。聚类分析过程通常可分为以下步骤:数据收集并且收集相应类分析过程通常可分为以下步骤:数据收集并且收集相应的变量;产生一个相似矩阵;决定把目标总体细分为
40、几类,的变量;产生一个相似矩阵;决定把目标总体细分为几类,及其对每一种类别相应的定义;实施聚类分析,产生结果。及其对每一种类别相应的定义;实施聚类分析,产生结果。 30精制类 主成分分析主成分分析是目前应用最为广泛的多维分析方法之一。是目前应用最为广泛的多维分析方法之一。PCA PCA 的特点是将分散在一组变量上的信息集中到某几个综的特点是将分散在一组变量上的信息集中到某几个综合指标,即主成分合指标,即主成分 (principal component(principal component,PC) PC) 上,利上,利用这些主成分来描述数据集内部结构,实际上也起着数据用这些主成分来描述数据集内
41、部结构,实际上也起着数据降维的作用。降维的作用。 主成分是由原始变量按一定的权重经线性组合而成的主成分是由原始变量按一定的权重经线性组合而成的新变量。这些变量具有以下性质:新变量。这些变量具有以下性质:1)1)每一个每一个 PC PC 之间都是之间都是正交的;正交的;2)2)第第1 1个个 PC PC 包含了数据集的绝大部分方差,第包含了数据集的绝大部分方差,第2 2个次之,依此类推。这样,由头个次之,依此类推。这样,由头2 2个或个或3 3个个 PC PC 作图,就能作图,就能够很好地代表数据集所包含的生物化学变化够很好地代表数据集所包含的生物化学变化 31精制类有监督方法有监督方法如果存在
42、一些有关数据的先验消息和假设,如果存在一些有关数据的先验消息和假设,有监督方法比非监督方法更适合且更有效。有监督方法有监督方法比非监督方法更适合且更有效。有监督方法在已有知识的基础上建立信息组在已有知识的基础上建立信息组 (class information)(class information),并利用所建立的组对未知数据进行辨识、归类和预测。,并利用所建立的组对未知数据进行辨识、归类和预测。 在这类方法中,由于建立模型时有可供学习利用的在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督学习。应用于该领域的常见训练样本,所以称为有监督学习。应用于该领域的常见方法有线性判别分
43、析方法有线性判别分析 (linear discrimination (linear discrimination analysis)analysis)、偏最小二乘法、偏最小二乘法- -显著性分析显著性分析 (PLS-(PLS-discrimination analysis) discrimination analysis) 和人工神经元网络和人工神经元网络 (artificial neural networks(artificial neural networks,ANN) ANN) 32精制类网上数据库网上数据库在信息时代,代谢组学的分析离不开各种代谢途径和在信息时代,代谢组学的分析离不开各
44、种代谢途径和升华数据库,利用网络资源进行研究是必不可少的,与基因组学和升华数据库,利用网络资源进行研究是必不可少的,与基因组学和蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完备数据库。尚无类似的功能完备数据库。DOME (DOME (http:/medicago.vbi.vt.edu/dome.htmlhttp:/medicago.vbi.vt.edu/dome.html) ) 有许多关于代谢有许多关于代谢物的原始数据和分析结果,分析结果用多维统计软件处理后可用于物的原始数据和分析结果,分析结果用多维统计软件
45、处理后可用于 OMEs OMEs 的浏览器的浏览器 (BROME) (BROME) 浏览。浏览。 MetaCyc (MetaCyc (http:/metacyc.orghttp:/metacyc.org) ) 是一个关于代谢物的数据库,阐述是一个关于代谢物的数据库,阐述了超过了超过150150种生物体中的代谢途径,包含了从大量的文献和网上资源种生物体中的代谢途径,包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料。中得到的代谢途径、反应、酶和底物的资料。MMP (MMP (http:/www.chem.qmul.ac.uk/iubmb/enzymehttp:/www.chem.
46、qmul.ac.uk/iubmb/enzyme) ) 对主要代谢途对主要代谢途径及涉及的关键酶进行了详尽的描述。径及涉及的关键酶进行了详尽的描述。 ArMet (ArMet (http:/www.armet.orghttp:/www.armet.org) ) 是一个涵盖大部分植物代谢组学研是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的时间,甚至还有详细的实验究工作的网站,包含了这些工作开展的时间,甚至还有详细的实验步骤,并将代谢物信息标准化,以便于研究者交流。步骤,并将代谢物信息标准化,以便于研究者交流。33精制类第三章第三章 代谢组学的应用代谢组学的应用代谢组学在微生物领域
47、的应用代谢组学在微生物领域的应用 ( (一一) )微生物分类微生物分类, ,突变体筛选以及功能基因研究突变体筛选以及功能基因研究经典的微生物分类方法多根据微生物形态学以及对经典的微生物分类方法多根据微生物形态学以及对不同底物的代谢情况进行表型分类。最近不同底物的代谢情况进行表型分类。最近, ,随着分子生随着分子生物学的突飞猛进物学的突飞猛进, ,基因型分类方法如基因型分类方法如16SrDNA16SrDNA测序测序,DNA,DNA杂杂交以及交以及PCRPCR指纹图谱等方法得到了广泛应用。然而指纹图谱等方法得到了广泛应用。然而, ,某些某些菌株按照基因型与表型两类方法分类会得出不同的结果。菌株按照
48、基因型与表型两类方法分类会得出不同的结果。因此因此, ,根据不同的分类目的联合应用这两类方法已成为根据不同的分类目的联合应用这两类方法已成为一种趋势。一种趋势。BIOLOGBIOLOG等方法在表型分类中应用较为广泛等方法在表型分类中应用较为广泛, ,但是但是, ,代谢谱分析方法代谢谱分析方法(metabolic p rofiling)(metabolic p rofiling)异军突异军突起起, ,逐渐成为一种快速、高通量逐渐成为一种快速、高通量, ,全面的表型分类方法。全面的表型分类方法。34精制类 采用代谢组分类时采用代谢组分类时, ,可以通过检测胞外代谢物来加可以通过检测胞外代谢物来加以
49、鉴别。常用的胞外代谢物检测方法为样品衍生化后以鉴别。常用的胞外代谢物检测方法为样品衍生化后进行进行GC2MSGC2MS分析、薄层层析或分析、薄层层析或HPLC2MSHPLC2MS分析分析, ,最后通过特最后通过特征峰比对进行分类。征峰比对进行分类。BundyBundy等采用等采用NMRNMR分析代谢谱成功分析代谢谱成功地区分开临床病理来源以及实验室来源的不同杆菌地区分开临床病理来源以及实验室来源的不同杆菌(bacillus cereus)(bacillus cereus)。 除了表型分类外除了表型分类外, ,代谢组学数据可以应用于突变体代谢组学数据可以应用于突变体的筛选。在传统研究中的沉默突变
50、体的筛选。在传统研究中的沉默突变体( (即未发生明显的即未发生明显的表型变化的突变体表型变化的突变体) )内内, ,突变基因可能导致了某些代谢突变基因可能导致了某些代谢途径发生变化途径发生变化, ,通过代谢快照通过代谢快照(metabolic snap shot)(metabolic snap shot)可以发现该突变体并研究相应基因的功能。可以发现该突变体并研究相应基因的功能。35精制类( (二二) )发酵工艺的监控和优化发酵工艺的监控和优化 发酵工艺的监控和优化需要检测大量的参数发酵工艺的监控和优化需要检测大量的参数, ,利用代谢组利用代谢组学研究工具可以减少实验数量学研究工具可以减少实验
51、数量, ,提高检测通量提高检测通量, ,并有助于揭示发并有助于揭示发酵过程的生化网络机制酵过程的生化网络机制, ,从而有利于理性优化工艺过程。从而有利于理性优化工艺过程。 BuchholzBuchholz等采用连续采样的方法研究了大肠杆菌在发酵过等采用连续采样的方法研究了大肠杆菌在发酵过程中的代谢网络的动力学变化。他们在葡萄糖缺乏的培养液培程中的代谢网络的动力学变化。他们在葡萄糖缺乏的培养液培养的大肠杆菌中加入葡萄糖养的大肠杆菌中加入葡萄糖, ,并迅速混匀并迅速混匀, ,按每秒按每秒4 45 5次的频率次的频率连续取样。利用酶学分析、连续取样。利用酶学分析、HPLC/LC2MSHPLC/LC2
52、MS等手段监测样品中多达等手段监测样品中多达3030种以上的代谢物、核苷以及辅酶种以上的代谢物、核苷以及辅酶, ,从而解析了葡萄糖以及甘从而解析了葡萄糖以及甘油的代谢途径和底物摄取体系。通过统计学分析建模油的代谢途径和底物摄取体系。通过统计学分析建模, ,发现在发现在接触葡萄糖底物后的接触葡萄糖底物后的151525s25s范围内范围内, ,大肠杆菌体内发生的葡萄大肠杆菌体内发生的葡萄糖代谢物变化与经典生化途径相符糖代谢物变化与经典生化途径相符, ,但随后的过程则与经典途但随后的过程则与经典途径不符径不符, ,推测可能存在新的未知调控步骤。推测可能存在新的未知调控步骤。TakorsTakors认
53、为认为, ,通过上通过上述代谢动力学研究述代谢动力学研究, ,掌握代谢途径及网络中的关键参数掌握代谢途径及网络中的关键参数, ,将直接将直接有利于代谢工程的优化有利于代谢工程的优化, ,包括菌株的理性优化以及发酵参数的包括菌株的理性优化以及发酵参数的调控。调控。 36精制类( (三三) )环境微生物研究环境微生物研究 微生物降解是环境中去除污染物的主要途径。深入了微生物降解是环境中去除污染物的主要途径。深入了解污染物在微生物内的代谢途径解污染物在微生物内的代谢途径, ,将有助于人们优化生物降将有助于人们优化生物降解的条件解的条件, ,从而实现快速的生物修复。这些代谢中间体大都从而实现快速的生物
54、修复。这些代谢中间体大都通过萃取、分析方法进行逐个研究通过萃取、分析方法进行逐个研究, ,并借助专家经验拟合出并借助专家经验拟合出代谢途径代谢途径, ,其动力学过程亦很少触及。代谢组学方法的采用其动力学过程亦很少触及。代谢组学方法的采用有可能改变这一现状。有可能改变这一现状。 BoersmaBoersma等采用代谢组学方法研究氟代酚的微生物降解等采用代谢组学方法研究氟代酚的微生物降解途径。氟代化合物具有特殊的途径。氟代化合物具有特殊的1919F F核磁共振属性核磁共振属性, ,1919F F的核磁的核磁共振灵敏度与共振灵敏度与1H1H核相近核相近; ;由于生物体内无内源性由于生物体内无内源性1
55、919F F核磁信核磁信号号, ,因而无本底干扰。所有因而无本底干扰。所有1919F F核磁信号均可归结于异生素核磁信号均可归结于异生素及其代谢物。及其代谢物。1919F F核的化学位移值宽核的化学位移值宽, ,约为约为700ppm(700ppm(1 1H H为为15ppm,15ppm,1313C C为为250ppm)250ppm)。较宽的化学位移导致。较宽的化学位移导致19 19 F F在不同取代在不同取代物的峰图不易产生重叠。因此物的峰图不易产生重叠。因此, ,借助核磁共振技术可以更方借助核磁共振技术可以更方便地研究含氟化合物的代谢中间体。便地研究含氟化合物的代谢中间体。 37精制类代谢生
56、物学在药物研发和疾病研究中的应用代谢生物学在药物研发和疾病研究中的应用 代谢组学在疾病动物模型的确证、药物的筛选、药效及毒代谢组学在疾病动物模型的确证、药物的筛选、药效及毒性评价、作用机制和临床评价等方面有着广泛的应用。性评价、作用机制和临床评价等方面有着广泛的应用。 Nicholson 研究小组利用研究小组利用NMR代谢组学技术,在药物毒代谢组学技术,在药物毒性评价方面开展了深入研究,结果表明代谢组学方法可判断性评价方面开展了深入研究,结果表明代谢组学方法可判断毒性影响的组织器官极其位点,推测药物相关作用机制确定毒性影响的组织器官极其位点,推测药物相关作用机制确定与毒性有关的签字生物标志物;
57、变在此基础上建立棵供毒性与毒性有关的签字生物标志物;变在此基础上建立棵供毒性预测的专家系统及毒物影响动物内源性代谢物随时间的变化预测的专家系统及毒物影响动物内源性代谢物随时间的变化轨迹。轨迹。 代谢组学在疾病的研究中的应用主要包括病变标志物的发代谢组学在疾病的研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和愈后的判断。现、疾病的诊断、治疗和愈后的判断。 目前报道较多在疾病研究的应用,如新生儿的代谢紊乱、目前报道较多在疾病研究的应用,如新生儿的代谢紊乱、冠心病、膀胱炎、高血压和精神系统疾病等。冠心病、膀胱炎、高血压和精神系统疾病等。38精制类 Nicholson Nicholson及其工
58、作组发现了给予氨基半乳糖的大鼠可以及其工作组发现了给予氨基半乳糖的大鼠可以被分为有反应和无反应两组,而这两组动物可以根据它们在给药被分为有反应和无反应两组,而这两组动物可以根据它们在给药前的尿代谢物来区分,他们第一次提到药物代谢组学的概念,并前的尿代谢物来区分,他们第一次提到药物代谢组学的概念,并将其定义为将其定义为“根据用药前代谢产物的特点来预测对个人进行药物根据用药前代谢产物的特点来预测对个人进行药物或外来物的干预的结果或外来物的干预的结果”。39精制类NMR flow probeN2 gasVarian Inova 600Shielded magnet120 ul flow probeG
59、ilson 215 autosamplerBiomek RobotRefrigeratedMetabolismCage (0o C.)Frozen Storage+ NaN3Deuterated BufferTSPData Processing40精制类SynthesisEfficacy/HTSEfficacy/In VivoLeadTOXINDP1P2P3Metabonomics in Drug DevelopmentPreclinical Efficacy BiomarkersPreclinical Safety Biomarkers andMechanismsRapid Throughp
60、ut Tox ScreeningClinical Efficacy BiomarkersClinical Safety BiomarkersPreLead PrioritizationDevelopment Timeline (Not to Scale)41精制类42精制类代谢组学在植物研究中的应用代谢组学在植物研究中的应用 植物代谢组学研究大多集中在代谢轮廓或代谢指植物代谢组学研究大多集中在代谢轮廓或代谢指纹图谱上。根据代谢对象的不同,植物代谢组学的研纹图谱上。根据代谢对象的不同,植物代谢组学的研究主要包括:究主要包括:1.1.某些特定种类植物的代谢组学研究。某些特定种类植物的代谢组学研究。
61、2.2.不同基因型植物的代谢学表型研究。不同基因型植物的代谢学表型研究。3.3.某些生态型植物的代谢组学。某些生态型植物的代谢组学。4.4.受外界刺激后植物自身的免疫应答。受外界刺激后植物自身的免疫应答。 代表性研究工作:利用代谢产物进行分类、鉴别代表性研究工作:利用代谢产物进行分类、鉴别和寻求植物代谢过程中的关键基因。和寻求植物代谢过程中的关键基因。43精制类代谢组学与中医药现代化代谢组学与中医药现代化 中药成分复杂,数量和质量制约因素多,作用机制中药成分复杂,数量和质量制约因素多,作用机制不明,毒性和不良反应认识不足,研究水平低,这些因不明,毒性和不良反应认识不足,研究水平低,这些因素严重
62、影响了中医药的发展,不能为西方社广泛接受。素严重影响了中医药的发展,不能为西方社广泛接受。 代谢组学的核心是研究外源性物质对生物体所产生代谢组学的核心是研究外源性物质对生物体所产生的整体效应。用它研究对机体所形成的内源性代谢组的的整体效应。用它研究对机体所形成的内源性代谢组的系统作用时,其研究方法与中医药治疗疾病的整体观念系统作用时,其研究方法与中医药治疗疾病的整体观念相一致,用其研究中药,对中药的药效作用物质基础、相一致,用其研究中药,对中药的药效作用物质基础、产生毒副作用的物质基础,正确认识用药剂量和疗程、产生毒副作用的物质基础,正确认识用药剂量和疗程、防止毒性反应都有重要意义。防止毒性反
63、应都有重要意义。 中药代谢与肠道菌群密切相关,了解肠道菌群的基中药代谢与肠道菌群密切相关,了解肠道菌群的基因组对中药汤剂的毒性和有效性的反应调节机制,可能因组对中药汤剂的毒性和有效性的反应调节机制,可能会开发出一种突破性的治疗方法会开发出一种突破性的治疗方法调节人体菌群治疗调节人体菌群治疗疾病。疾病。44精制类代谢组学的问题和展望代谢组学的问题和展望1.1.庞大数据的处理问题庞大数据的处理问题如何建立合理有效的数据分析平台如何建立合理有效的数据分析平台2.2.数据的解释问题数据的解释问题如何判断代谢组分析结果与基因的表达或阻遏的对应如何判断代谢组分析结果与基因的表达或阻遏的对应3.3.低浓度代
64、谢物的分析低浓度代谢物的分析如何富集低浓度代谢物而不引起试验误差如何富集低浓度代谢物而不引起试验误差4.4.代谢组学和其它组学的拟合代谢组学和其它组学的拟合5.5.商品化的数据软件和图谱库缺乏、不完善商品化的数据软件和图谱库缺乏、不完善6.6.细胞代谢的瞬时状态较难反映细胞代谢的瞬时状态较难反映 代谢组学的发展仍处于初始阶段,在方法学和应用两方面均面临极大的挑代谢组学的发展仍处于初始阶段,在方法学和应用两方面均面临极大的挑战,需要其他学科的配合和交叉。战,需要其他学科的配合和交叉。 全组分分析和动态分析将不断发展,非歧视性检测尚待时日;能否从大量全组分分析和动态分析将不断发展,非歧视性检测尚待时日;能否从大量代谢产物中找出特异性生物标志物决定了此技术能否在广泛应用的重要因代谢产物中找出特异性生物标志物决定了此技术能否在广泛应用的重要因素,不同代谢组学的整合建成的网络图对于快速识别早期标志物及生理过素,不同代谢组学的整合建成的网络图对于快速识别早期标志物及生理过程的关键组分非常有用。程的关键组分非常有用。 应用方面,代谢组学要想生存发展,必然要有特色,要从表形入手回答应用方面,代谢组学要想生存发展,必然要有特色,要从表形入手回答其他组学不能回答的生物问题。其他组学不能回答的生物问题。45精制类