生物多样性信息学进展.doc

上传人:壹****1 文档编号:544046227 上传时间:2024-03-29 格式:DOC 页数:18 大小:172.50KB
返回 下载 相关 举报
生物多样性信息学进展.doc_第1页
第1页 / 共18页
生物多样性信息学进展.doc_第2页
第2页 / 共18页
生物多样性信息学进展.doc_第3页
第3页 / 共18页
生物多样性信息学进展.doc_第4页
第4页 / 共18页
生物多样性信息学进展.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《生物多样性信息学进展.doc》由会员分享,可在线阅读,更多相关《生物多样性信息学进展.doc(18页珍藏版)》请在金锄头文库上搜索。

1、生物多样性信息学研究进展与发展趋势许哲平1,陈彬1,王利松1,乔慧捷2,刘凤红1,覃海宁1,纪力强2,马克平11 中国科学院植物研究所,北京 1000932 中国科学院动物研究所,北京 100101摘要 随着大数据时代的来临,传统的生物多样性研究开始逐渐向数据密集型的科研方式过渡。国际上,生物多样性信息学在不同类型的数据库平台(名录、标本、文献、照片、社区等)建设、分析和建模方法、集成式的学科思想趋势和产品等方面都有较好的发展。近年来,我国对基础性科技平台项目的支持力度快速加强,在专业数据库平台(物种生物多样性相关平台、遗传多样性相关平台和专业文献平台等)、公民科学平台和国际合作等方面取得了良

2、好进展,在生物标本数字化、生物物种名录的编研和公民科学平台等方面具有一定的优势。未来的生物多样性信息学将会在全球生物多样性信息学展望(GBIO)的整体框架下,加强与物种相关的宏观和微观数据的整合,充分利用开放的技术和云平台,建立和管理科学工作流,推动生物多样性科学的信息化和现代化。我国未来则需要在资源整合和挖掘、数据共享和公民科学平台等方面继续加强建设,并通过亚洲生物多样性保护与信息网络(ABCDNet)等渠道向亚洲区域辐射,不断增强国际影响力。关键词:生物多样性信息学;公民科学;物种名录;数据挖掘;信息服务;科学工作流;1. 引言当前,由于全球环境变化,特别是生物多样性快速丧失,引起国际社会

3、和各国政府的广泛关注。人们对生物多样性重要性认识越来越深刻。而随着信息技术在生物多样性研究领域的不断渗透和大数据时代的到来,生物多样性研究与信息技术融合产生的新学科生物多样性信息学(biodiversity informatics) 也逐步形成和发展。这是一门利用信息技术,对生物多样性基础数据的采集收藏、存储管理、检索共享和分析解释的新学科,其内容覆盖了系统学、进化生物学、居群生物学、行为科学,以及从传粉生物学到寄生病学和植物群落学等领域(王利松等,2010)。目前,生物多样性信息学的核心问题是解决 有什么、在哪里和怎么用的问题。有什么主要通过生物物种名录来回答,包括分类学名称的处理及其系统结

4、构,序列信息,特别是条形码数据,主要用于分类和构建系统树;在哪里主要通过标本数字化/地标化、文献数字化、公民科学的观察数据、遥感影像解译出的生态系统/生境结构和分布数据、模型预测的物种潜在分布信息等;怎么用主要通过在线工具和科学工作流等eScience平台,实现生物多样性信息整合和深度挖掘,为相关学科的研究人员、决策者和管理者提供个性化服务。为了实现这三个目标,需要信息学的帮助,主要是数据标准、在线管理与共享平台,包括可视化等方面的技术。近年来,国际上生物多样性信息学发展非常迅速。在数据方面,物种名录从Species 2000的135万条物种名称(2013年版),到uBio(http:/www

5、.ubio.org)的1110万条生物名称,再到GNA(Global Name Architecture)的2000多万条名称。在标本数据方面,GBIF(Global Biodiversity Information Facility)已经累计有4亿条各类生物观测数据。在文献方面,BHL(Biodiversity Heritage Library)已经扫描上线了11.6万册(4131万页)的生物多样性文献资料。在DNA条形码数据方面,目前iBOL(The International Barcode of Life)已经积累了18.1万种的224.3万条测序,距离2015年底完成50万种500万

6、条测序的目标还有一段距离,但是总体看完成任务难度不大;而NCBI(National Center for Biotechnology Information)上面有近1.35亿条序列可以开放获取。数据增长和应用的需求必须要有数据标准相适应,灵活性和兼容性都很强的Darwin Core Archive则为多源数据的使用和集成提供了良好的便利,GBIF等项目也为其提供了多种处理和分析工具。数据和工具在科研工作中是基础环节,需要更多科研和政策需求的驱动。随着Species 2000、GBIF等以数据积累为目标的生物多样性信息学项目或网络体系的不断发展,一些新项目和网站开始出现, 包括国际对地观测组织

7、生物多样性观测网络(GEO BON)、欧盟的生物多样性e-Science项目(LifeWatch)、澳大利亚的Atlas of Living Australia项目和美国的DataONE观测项目。在项目发展方面,公民科学项目不断涌现,成为传统项目的有益补充。这些项目都从不同方面来完善和补充生物多样性的数据,并提供个性化的功能和工具。此外,国际学术会议也为各国同行的交流提供了良好的平台,TDWG(Biodiversity Information Standards)每年的年会都是一次很好的技术交流分享机会。2009年的第一届e-Biosphere全球大会在英国伦敦举行,来自69个国家的503位生

8、物多样性信息学研究人员参加了会议。会议成果将对未来几年的生物多样性信息学发展产生重要影响。2012年7月在丹麦哥本哈根举行的全球生物多样性信息学大会上,100多位来自生物多样性信息学、遗传学、地表观测、自然历史馆藏、生物多样性领域的专家学者聚集一堂,就充分利用信息技术、社交网络来支持生物多样性知识库建设和决策制定等问题进行了积极探讨,并形成了一个重要的报告Global Biodiversity Informatics Outlook (全球生物多样性信息学展望,简称GBIO)。为未来十年全球生物多样性信息学的发展指明方向。在我国,从20世纪80年代末开始进行物种数据库建设,到20世纪90年代在

9、世界银行贷款(BRIM)等项目的资助下开始建设中国生物多样性信息系统(CBIS),由中国科学院的15个研究所参加,形成了覆盖全国的生物多样性信息网络。21世纪初,中国科学院生物标本馆网络信息系统建设项目开始启动(马克平等,2010),并进一步得到科技部“标本资源的标准化整理、整合与共享平台建设项目”的持续支持,形成目前国家标本资源共享平台近1000万份标本数据的生物多样性信息共享平台。2005年以来,在中国科学院生物多样性委员会等相关组织的大力推动下,积极与国际著名的生物多样性信息学项目(如Species 2000、EOL、BHL、GBIF、iBOL等)合作,大力提升了中国在这个领域的影响力。

10、并于2009年开始组织召开两年一次的 “全国生物多样性信息学研讨会”,搭建了专业的学术交流平台,推动该学科在国内的发展。在我国,生物多样性信息学已经在分类学基础研究、濒危物种评估、生物地理格局认知、生物资源本底调查和监测等方面的工作中得到了较好的应用和推广。大数据时代的来临已经是大势所趋。2012年无疑是大数据从理论走向实际应用的元年。这一年,从达沃斯世界经济论坛发布的大数据,大影响:全球发展新的可能性、美国发布的大数据研究和发展倡议和联合国Global Pulse倡议项目发布的大数据的发展:挑战与机遇的一系列报告将以前学术界讨论的“大数据”概念落地,也将会在今后的几年里对相关的学术界和产业界

11、产生重大影响。生物多样性信息学身处其中,也将面临更多的机遇和挑战。2. 重要进展评述2.1生物物种名录生物物种名录既是生物分类学研究的核心问题之一,也是生物多样性保护与利用所依赖的科学基础。名录应该包括如下5个方面的基本信息:接受名及其原始发表文献;异名及其原始发表文献,异名与接受名的关联关系;最近的专家审核情况(包括审核人和审核时间);地理分布信息;信息来源(数据的提供者或参考文献) (Patonet al., 2008)。据粗略估计,全球有花植物约22万40万种,涉及的学名(拉丁名)达百万以上(Govaerts, 2003; Kier et al., 2009)。物种编目信息的数字化工作见

12、证了计算机信息技术在生物多样性领域应用的发展历程。从20世纪80年代初的邱园索引(Index Kewensis)到90年代由许多国际组织联合建立的国际植物学名索引 (International Plant Name Index,IPNI)、整合分类学信息系统 (Integrated Taxonomic Information System,ITIS)、美国密苏里植物园的TROPICOS,以及近些年在全球编目数据库中占有重要地位的全球生物物种名录(Catalogue of Life, CoL)和世界植物名录(The Plant List, TPL)等全球性电子名录;以及以类群为主的国际豆科植物信

13、息系统 (International Legume Database & Information Service,ILDIS)、全球菊科植物名录(Global Compositae Checklist)、鱼类数据库(FishBase)和以地区为主的非洲植物名录数据库项目 (African Plant Checklist and Database project,APCD)(Klopper et al., 2007)、澳大利亚植物名称索引 (Australia Plant Names Index,APNI)、北美植物志整合系统 (Synthesis of the North American F

14、lora,SNAF)和中国生物物种名录(CoL-China)等。近年来,信息技术的发展极大地改善了传统分类编目研究的工作模式,使科学家们开始思考在网络信息时代的分类学研究(Wheeler, 2004; Alves et al., 2007)。提出了诸如电子分类学(etaxonomy)(Mayo, 2008)、全球统一分类(Unitary taxonomy)( Scoble, 2004)等概念和项目。也有多个世界著名研究机构在积极开展电子分类学的实践活动,例如:由英国自然环境研究理事会(Natural Environment Research Council, NERC)资助,英国自然历史博物馆

15、(The Natural History Museum)、牛津大学(University of Oxford)和英国皇家植物园邱园(Royal Botanic Gardens Kew)联合发起的CATE (Creating a Taxonomic E-Science)项目;世界茄科植物数据库(Solanaceae Source);世界禾草数据库(GrassBase);以及欧洲分布式分类学研究所(European Distributed Institute of Taxonomy,EDIT)等。要实现网络环境下的分类学协同工作环境,关键是要建立起科学和合理的分类编目信息基础。首先,需要区别目前信

16、息化实践中两类名称数据系统:索引数据库和分类学数据库。前者只包括学名及其名称来源,后者包括异名处理、分类阶元、地理分布等信息(Lughadha, 2004; Page, 2006)。其次,如何探知分类学实践中分类观点的异同,并有效展示这些差异,为信息组分间准确的关联和追溯奠定基础。近几年相当多的信息化实践都集中在这个部分,比如生物分类树工具(Taxonomic Tree Tool ,TTT)和Taxonomic Name Resolution Service (TNRS)。生物分类树工具是中国科学院动物研究所生物多样性信息学研究组开发的基于Web的管理和比较各种生物分类树的工具。TTT提供多种方法让用户建立自己的分类树并与其他用户共享,还提供分类树比较功能,发现并用图形化方式标注出差异,能够帮助分类学家摆脱单阶元对单阶元的分类系统比较模式,提高对大数据量的分类体系比较的效率。目前TTT已经被国际知名的生物多样性信息学网站GNA(http:/global

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号