关系数据库模式到本体映射的研究

上传人:f****u 文档编号:115148916 上传时间:2019-11-12 格式:PDF 页数:88 大小:2.33MB
返回 下载 相关 举报
关系数据库模式到本体映射的研究_第1页
第1页 / 共88页
关系数据库模式到本体映射的研究_第2页
第2页 / 共88页
关系数据库模式到本体映射的研究_第3页
第3页 / 共88页
关系数据库模式到本体映射的研究_第4页
第4页 / 共88页
关系数据库模式到本体映射的研究_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《关系数据库模式到本体映射的研究》由会员分享,可在线阅读,更多相关《关系数据库模式到本体映射的研究(88页珍藏版)》请在金锄头文库上搜索。

1、 分类号 TP311.13 学号 09061123 U D C 密级 公 开 工学硕士学位论文 关系数据库模式到本体映射的研究关系数据库模式到本体映射的研究 硕士生姓名 刘海池 学 科 领 域 计算机科学与技术 研 究 方 向 软件工程 指 导 教 师 宁洪 教授 国防科学技术大学研国防科学技术大学研究生院究生院 二一一年十一月二一一年十一月 关 系 数 据 库 模 式 到 本 体 映 射 的 研 究 国 防 科 学 技 术 大 学 研 究 生 院 Research on Mapping Relational Database Schema to Ontology Candidate:Liu

2、Haichi Advisor:Prof. Ning Hong A thesis Submitted in partial fulfillment of the requirements for the degree of Master of Engineering in Computer Science and Technology Graduate School of National University of Defense Technology Changsha,Hunan,P.R.China November,2011 国防科学技术大学研究生院硕士学位论文 第 I 页 目目 录录 摘

3、 要 . i ABSTRACT . ii 第一章 绪论 1 1.1 课题研究背景和意义 . 1 1.1.1 分布异构数据整合需求 1 1.1.2 元数据、本体及其在数据集成中的应用 2 1.1.3 自动映射算法研究的必要性 3 1.2 课题研究内容 . 4 1.2.1 课题来源 4 1.2.2 主要研究内容 6 1.3 论文结构 . 7 第二章 关系数据库模式到本体映射技术研究 8 2.1 模式间映射 . 8 2.1.1 模式间映射的概念 8 2.1.2 模式间映射技术分类 8 2.1.3 主要的模式间映射系统 12 2.2 本体间映射 . 13 2.2.1 本体间映射的概念 13 2.2.2

4、 本体映射技术分类 13 2.2.3 本体间映射方法 15 2.3 关系数据库模式到本体的映射 . 16 2.3.1 问题的特殊性 16 2.3.2 方法分类 18 2.3.3 相关工作 18 2.4 本章小结 . 19 第三章 基于 CWM 元仓库和本体标注技术的数据整合系统设计 . 21 3.1 数据整合系统框架与流程 . 21 3.1.1 数据整合系统框架 21 3.1.2 数据整合流程 22 3.2 集成冲突分析及解决 . 23 3.2.1 命名冲突 24 国防科学技术大学研究生院硕士学位论文 第 II 页 3.2.2 结构冲突 24 3.2.3 属性冲突 25 3.3 原型系统关键模

5、块设计 . 25 3.3.1 集成冲突消解模块 25 3.3.2 查询生成模块 26 3.3.3 结果连接整合模块 27 3.3.4 数据转换与写入模块 27 3.4 本章小结 . 27 第四章 一种关系数据库模式到本体的混合映射算法 . 28 4.1 问题定义 . 28 4.2 映射算法整体框架 . 30 4.3 元素级映射 . 32 4.3.1 基于词义的相似度计算 32 4.3.2 基于字符串的相似度计算 34 4.3.3 数据类型相似度计算 35 4.4 结构级映射 . 36 4.4.1 结构级相似性特征 37 4.4.2 结构级相似度计算方法 38 4.5 相似度综合 . 40 4.

6、6 映射结果的筛选 . 41 4.7 本章小结 . 43 第五章 本体标注工具的设计及实现 44 5.1 HyMRO 实现简介 44 5.1.1 HyMRO 的总体框架 44 5.1.2 HyMRO 的具体实现 45 5.2 HyMRO 实验分析 . 47 5.2.1 评测参数 47 5.2.2 测试数据集 49 5.2.3 系统参数设置 50 5.2.4 实验结果 52 5.3 本体标注工具的框架及功能说明 . 53 5.3.1 本体标注工具框架 54 5.3.2 标注工具功能说明 54 5.4 使用案例 . 55 国防科学技术大学研究生院硕士学位论文 第 III 页 5.5 本章小结 .

7、60 第六章 结束语 61 6.1 工作总结 . 61 6.2 前景展望 . 62 致 谢 64 参考文献 . 65 作者在学期间取得的学术成果 . 69 附录 A 测试数据 Conference 中的模式和本体 70 国防科学技术大学研究生院硕士学位论文 第 IV 页 表 目 录 表 2.1 映射基数分类示例 10 表 2.2 混合方式和组合方式的比较 12 表 3.1 查询生成算法 26 表 4.1 缩写词词典 33 表 4.2 一些字符串的相似度值 35 表 4.3 关系数据库模式和本体的数据类型相容性表 36 表 5.1 测试数据集中关系数据模式和本体的基本特征 50 表 5.2 实验

8、中所用参数值 51 表 5.3 HyMRO 与其他系统对比表 . 53 表 A.1 关系数据库模式 vldb.schema 70 国防科学技术大学研究生院硕士学位论文 第 V 页 图 目 录 图 1.1 基于元数据的分布式数据资源整合架构 5 图 2.1 模式间匹配方法分类 9 图 2.2 本体映射技术分类 14 图 2.3 关系数据库模式和本体间映射分类 18 图 3.1 数据整合系统框架示意图 22 图 3.2 数据整合流程示意图 23 图 3.3 原型系统模块图 25 图 4.1 关系数据库模式到本体映射问题示例 29 图 4.2 映射算法流程 31 图 4.3 关系数据库模式和本体的示

9、例 37 图 4.4 结果筛选示意 41 图 5.1 HyMRO 的类图 . 45 图 5.2 包 element 的类图 . 46 图 5.3 评测参数取值示意图 48 图 5.4 各测试用例实验结果 52 图 5.5 F-Measure 值同 RONTO、MARSON 的比较 . 53 图 5.6 本体标注工具系统模块图 54 图 5.7 标注工具界面图 55 图 5.8 标注流程图 56 图 5.9 关系数据库模式 vldb 和本体 conference 57 图 5.10 标注信息浏览界面截图 58 图 5.11 手工编辑后的标注结果 60 图 A.1 本体 conference.ow

10、l 72 国防科学技术大学研究生院硕士学位论文 第 i 页 摘 要 随着生物工程领域各种技术的飞速发展,生物数据呈指数级增长。如何对这 些分布、异构、自治的生物数据库进行快速有效的整合,提供数据查询服务成为 生物信息研究的一个热点问题。为了解决目前生物数据集成查询中遇到的问题, 作者所在课题组提出了一个基于语义元数据的数据资源整合方案。该方案首先将 要查询的各分布数据库的元数据按照统一的元数据标准集成到一个元仓库中,再 使用一个领域本体对元仓库中数据进行标注生成语义元数据,试图利用结构元数 据和语义元数据一起解决异构数据库源的集成问题,实现对各生物数据库的数据 查询。 本文以课题组建立的元数据

11、库和本体库为基础,提出了基于 CWM 元仓库和 本体标注技术的数据整合系统的设计实现方案,并针对该系统中的用于生成语义 元数据的重要模块,研究实现了关系数据库模式到本体的自动映射算法,开发了 半自动化的本体标注工具。 具体研究内容包括: 1) 提出了一个基于 CWM 元仓库和本体标注技术相结合的数据资源整合系统 和完整的数据整合过程,并研究了如何基于本体信息解决集成中的语义冲突问题。 2) 分析研究了现有的三类模式间映射问题,即数据模式间映射、本体间映射 和关系数据库模式到本体映射。 3) 针对领域数据集成的需要,提出并实现了一种关系数据库模式到本体的混 合映射算法,该算法在元素级映射时,不但

12、考虑了元素名称字符串本身的相似性, 还使用了基于 WordNet 的相似度算法,计算了元素名称在语义上的相似性;在结 构级映射时,根据映射元素的不同类型所表现出的结构特征,计算了结构上的相 似性。 4) 基于所提映射算法,设计实现了本体标注工具,能辅助领域专家进行本体 标注,即领域专家可以对工具自动发现的映射进行确认和更改,从而将领域专家 从大量繁重的比对中解放出来。 实验表明,本文提出的算法与以往系统相比取得了较好的映射结果。基于映 射算法的本体标注工具能够辅助领域专家更便捷的完成本体标注工作,下一步可 以作为课题组提出基于元数据的蛋白质组学数据资源整合架构中的语义元数据生 成工具,推动下一

13、步研究工作。 主题词: 数据集成,关系数据库模式到本体的映射,本体标注,本体,元数 据 国防科学技术大学研究生院硕士学位论文 第 ii 页 ABSTRACT With the rapid development of bioengineering technology, the biological data grows exponential. How to integrate these distributed, heterogeneous, autonomous biological databases effectively and provide query services is

14、becoming a hot topic. In order to address the current problems encountered in the integrated query of biological data, a data integration program based on semantic metadata is proposed by the research group of which the author is a member. Firstly, the metadata of the distributed database to be quer

15、ied is integrated into a metastore in accordance with the uniform metadata standards. Then the metadata is annotated with domain ontology to generate semantic metadata. The program tries to exploit structural metadata and semantic metadata to address heterogeneous database integration issues, enabli

16、ng the query on various biological databases. On the basis of the meta store and ontology repository established by the research group, the design and implementation of a data integration system based on CWM Metastore and ontology annotation technique is proposed in this paper. An algorithm of mapping relational database schema to ontology for the important module of building semantic metadata in the system is studied and implemented.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号