中医药学数据库进展策略

上传人:cl****1 文档编号:473395826 上传时间:2022-10-01 格式:DOC 页数:7 大小:33KB
返回 下载 相关 举报
中医药学数据库进展策略_第1页
第1页 / 共7页
中医药学数据库进展策略_第2页
第2页 / 共7页
中医药学数据库进展策略_第3页
第3页 / 共7页
中医药学数据库进展策略_第4页
第4页 / 共7页
中医药学数据库进展策略_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《中医药学数据库进展策略》由会员分享,可在线阅读,更多相关《中医药学数据库进展策略(7页珍藏版)》请在金锄头文库上搜索。

1、中医药学数据库进展策略刘岩 , 尹爱宁 , 周雪忠 , 宓京华【关键词】中医药学;数据库;结构化;数据整合中医药学数据库的成立起源于20 世纪 80 年代 1, 至今已经成立一大量中医药数据库并效劳于专业人员, 在推动行业进展与科研创新中产生了重要作用。进入21 世纪后 , 中医药学数据库的数据量呈现了迅猛增加的态势 , 数据库的建设形式与效劳方式也都呈现出多元化的特点。以中国中医科学院为例 , 从 2000 年到此刻 , 已经从 8 个数据库进展为 118 个, 数据从 4 G 进展为 236 G;数据库也从文献型为主, 进展为结构型与数据仓库类型。面对迅猛增加的中医药数据 , 如何对原始数

2、据进行存储、治理、注释、加工、解读 , 并通过数据分析、 处置 , 揭露这些数据的内涵 , 知足专业人员需求是一个新的问题。 专门是如何以应用为导向 , 研制适应于数据深度利用方式的结构型数据库、支持个性化扩展效劳的知识型数据库 , 和知足需求的全文数据库是当前数据库建设的进展方向。 针对中医药数据库建设而言 , 提出适应现状进展策略是当前需要解决的重要问题。1 文献数据库结构化处置随着网络技术的普及与信息发布的便利性, 数据量呈快速上升趋势。 IDC(互联网数据中心 )2007 年研究报告“数字宇宙膨胀:到2020 年全世界信息增加预测”指出,2006 年全世界每一年制造、复制出的数字信息量

3、共计1 610 亿 GB,约是有史以来出版的图书信息总量的 300 万倍。从 2006 年到 2020 年, 数字宇宙的信息量将增加6 倍多;到 2020 年, 数字信息量估量为 9 880 亿 GB2 。生物信息学、基因遗传学的进展 , 也带动了相关医学研究的进展 , 医学文献增加位居各学科之首 , 截止 2020 年 7 月,PubMed已经拥有亿篇文献 3 。研究人员如何才能应付现代方式所产生的大量数据流, 如何从上亿篇文献中提取研究利用的数据, 文献数据结构化是解决那个难题的有效方式之一。2020年 , Nature 杂 志 在 “ BigData ” 一 文 中 提 出了“Biocu

4、ration( 生物文献数据结构化 ) ”的概念 , 提出利用数据结构化处置 , 完成对文本生物学信息的组织、表示、转化的程序 , 使得人与机械都能够方便的获取数据 3 。中医药数据库自 2000 年开始 , 尽管进行了文献数据库的结构化处置 , 以中药化学、中药药理、临床疾病研究为主线 , 成立了多个结构化处置的数据库 , 但结构化数据的处置是一个难度大、 本钱高的人力密集的工作 , 需要中医药专业与运算机专业结合的复合性人材。因此 , 中医药学结构型数据库与医学生物数据库一样结构化的处置能力远远掉队于数据生成速度。面对数据结构化处置的需求 , 应该从 3 个方面采取行动 , 以推动这一关键

5、领域。第一 , 以中医药研究人员的需求为导向 , 认真研究中医药结构处置模式 , 确立公认的标准的结构模板;第二 , 作者、期刊与结构化处置人员之间互换协议 , 直接获取结构化数据;第三 , 培育数据处置的专业人员 , 使之成为专职的数据整理与处置的团队。2 中医药数据资源质量评判与分级中医药海量数据提供的真实性与有效性是科研人员关注的核心,如何从海量数据库中挑选出所需的研究数据也是要解决的重要问题之一。中医药数据库能够增加数据评判形式, 依据中医药学特点 , 提示数据来源的靠得住性 , 是不是有课题资助、 作者的背景、项目的研究周期、产生的功效;同时 , 依据循证医学与中医学文献评判指标进行

6、分级提示。研究人员能够迅速处置大量复杂的数据, 深切了解领域的研究进展, 将查询数据时刻充分利用到实验中。 在此基础上慢慢成立实验数据评判机构 , 辅助参加实验室的研究工作 , 增进实验研究水平 , 扩充实验室规模。3 成立中医百科知识网络图谱2020 年, 生物医学信息学第一次提诞生物信息维基组学的概念,其目的在于解决当前海量数据的知识发觉。生物信息与基因、蛋白质组学研究具有一样的群体研究的需求特点 , 需要在一个平台上 , 构建群体知识网络 , 设计数据搜集的标准模式 , 形成一个百科知识图谱 , 加速生物学的进展。笔者以为 , 中医百科知识网络图谱成立应该立足以下两个方面。知识资源描述依

7、照中医药数据集的元数据概念 , 对信息对象的内容和位置进行描述 , 从而为信息对象的存储与利用奠定基础。 先从庞杂的网络信息资源数据中获取有效信息 , 再明白得其中的逻辑关系或模式形成知识, 这是一个增值的进程。其进程中所采取的方式 , 除与网络信息资源的形式特点有关外 , 最全然的依据仍是描述网络信息资源的元数据。 通过标准元数据能够合理地描述与揭露网络信息资源的内涵 , 由网络机械人对元数据进行标引和分类 , 再适当进行知识组织 , 将其添加到相关智能搜索引擎数据库中 , 通过具有必然智能性的检索工具 , 就能够够十分容易地获取有关知识。基于语义进行搜索中医药语言系统提供语义搜索的基础 ,

8、 将信息对象中的重要信息掏出 , 加以抽象描述 , 并成立其语义关系 , 使检索结果加倍准确 , 从而有利于用户识别资源的价值 , 发觉其真正需要的资源。目前 , 中医药智能搜索确实是采纳这种原理而研制的 , 在用户与信息资源之间创建了一个知识库 , 那个知识库实质上确实是语义的集合。其中的知识语义网络可粗略分为 3 个层面:一是语言层 , 反映语言表面现象的知识 , 如一个词的多种形式 , 它的同义词、反义词 , 一些适应用语、词的层次关系等;二是本体论层 , 对概念的本体论概念与说明 , 概念之间复杂的语义关系;三是常识层 , 发觉常识上的关联 , 例如疾病相关的病因、病机、诊断、医治等。

9、基于信息资源知识描述与中医药语义搜索的双核驱动的方式 , 从数据外部与内在关联进行有机整合 , 为知识发觉提供了重要途径。4 面向专题的多类型数据整合效劳对用户来讲 , 理想的状态是:通过一个界面即可迅速查到所需信息并加以取用 , 系统扩展整合功能可帮忙用户实现其理想。 系统扩展整合功能是指数据库开发商借助互联网 , 利用超文本技术 , 在不同的信息资源之间进行链接 , 将本来彼此独立、但互为联系的信息资源与效劳整合在一块 , 使之形成一个互动的有机整体。中医药数据库的大小和其功能的强弱决定了数据库的利用价值 , 中医药信息数据库系统也将同其他的数据库系统一样朝着大型数据库系统进展。由于不同的

10、历史时期成立的不同的数据库积存 , 形成了数据库之间的沟壑 , 每一个数据库不同的效劳方式 , 给科研人员带来了应用障碍。解决当前的问题 , 除数据库整合外 , 增加数据库的功能 , 能够弥补传统数据库系统诸多不足 , 知足诸多学科进展的需要。中医药数据库需要扩充的要紧功能为: 增加不同层次、 级别的关系揭露与指引 , 揭露不同加工层次和文献级别的数字资源之间的关系, 并基于这种关系 , 成立从二次文献、结构型数据库到一次文献的全文指引和链接。扩充学科逻辑主线导航和指引 , 按学科或主题相关的聚合 , 成立适用于揭露资源的整体逻辑关系的智能导航 , 解决由于异构带来的关系阻隔。研制对象互操作性

11、挖掘内在、动态的复杂联系,预先发觉并找出一种途径和线索来描述这些关系 , 将数字资源深层的内在联系挖掘与实现。成立引证关系 ( 引用、被引 , 同被引 ), 揭露学科和主题的内在、普遍和深层的关联 , 专门是关于交叉学科、边缘学科、新兴学科 , 能够从多维角度反映学科间的彼此渗透和彼此交叉的关系 , 增进基于知识治理的研究团队的开放式链接和整合。【参考文献】1 崔 蒙. 中医药行业数据库建设现状分析 J. 中国中医药信息杂志 , 2004,11(3) :189191.2 郭 涛. 如何应付数字宇宙膨胀的挑战 N. 中国运算机报,2007-07- 12(21).3 Mitch Waldrop. Big data : WikiomicsJ. Nature,2020,(455) :47.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号