基于xml的异构数据库数据集成技术的研究

上传人:E**** 文档编号:118218860 上传时间:2019-12-11 格式:PDF 页数:65 大小:2.17MB
返回 下载 相关 举报
基于xml的异构数据库数据集成技术的研究_第1页
第1页 / 共65页
基于xml的异构数据库数据集成技术的研究_第2页
第2页 / 共65页
基于xml的异构数据库数据集成技术的研究_第3页
第3页 / 共65页
基于xml的异构数据库数据集成技术的研究_第4页
第4页 / 共65页
基于xml的异构数据库数据集成技术的研究_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《基于xml的异构数据库数据集成技术的研究》由会员分享,可在线阅读,更多相关《基于xml的异构数据库数据集成技术的研究(65页珍藏版)》请在金锄头文库上搜索。

1、 摘要 I 摘要摘要 随着数据库技术的发展和网络的普及, 大量的数据被存放在异构数据库中, 不利于数据的共享;而越来越多的信息系统需要共享异构数据库中的数据。因 此,异构数据库数据集成具有重要的理论意义和实用价值,相关技术也成为研 究人员研究的热点。 本文介绍了多数据源异构数据集成的基本知识和研究情况,分析了当前异 构数据库系统面临的问题、主要的技术难点、主要的集成方法、以及当前技术 解决方案的优缺点。XML 技术作为 20 世纪 90 年代发展起来的技术,具有与平 台无关、易于扩展、交互性好、语义性强、可格式化等特点,XML 为信息的标 准化提供了最有力的工具,是一种发展势头良好的新兴的数据

2、集成手段,基于 XML 技术的异构数据集成逐渐成为研究热点。本文简要介绍了 XML 技术的核 心知识,针对异构数据集成过程中的模式转换问题,研究了 XML 模式与关系 模式的转化方法。在 DTD 模式与关系模式映射方法的基础上,通过定义、改进 XML Schema 与关系模式之间的转换规则,实现了 XML 模式与关系模式的映 射,并给出了核心算法。该方法不仅实现了模式之间的转换,而且还能保持数 据的约束要求。在数据集成过程中,当涉及到 XML 文档的读写时,已有的主 流技术如 DOM、SAX 等存在一定的局限,为提高读写的效率,文中提出了一 种新的解决方案,对 XML 文档进行切片处理,文中给

3、出了相应的逻辑设计方 案和具体操作步骤,然后讨论了处理的时应该注意的事项具体方法及方案的可 行性。最后对论文进行了总结并进行了展望。 关键字:XML 模式,关系模式,异构数据集成,XML 访问 Abstract II Abstract With the development of database technology and the popularization of network, a lot of data were stored in many heterogeneous databases, thus data sharing is unfavorable. On the oth

4、er hand, more and more information systems need to access the data stored in those heterogeneous databases. So the data integration for heterogeneous database is very important theoretically and practically, and the technology of data integration becomes a hotspot for researchers. The basic contents

5、 and research situation about heterogeneous database data integration were introduced in this paper, the technology problems, integration methods and the difference among current solutions were analyzed also. As a new technology, XML becomes a good tool for data integration gradually for its feature

6、s such as extensible, interactive, platform-independent, etc. In this paper, the conversion method between XML schema and relation schema was discussed in the process of heterogeneous data integration. On the basis of mapping rules between DTD and relation schema, an approach to set up conversion of

7、 XML Schema and relation schema was presented throughout the definition and improvement of the mapping rules between XML Schema and relation schema, and the algorithm was presented too. This method not only achieves the conversion between the two schemas, but also keeps most of the semantic attribut

8、es and constraints of the data. In the process of data integration, when it comes to the reading or writing of XML documents, there are some limitations with the mainstream of technologies such as DOM and SAX etc. A new approach was presented to improve the efficiency of accessing the XML documents

9、in this paper, the method is to break the whole XML document into some “small” files, the blue print was presented. Finally the deal with the specific methods and the feasibility was discussed. Keywords: XML schema, relation schema, heterogeneous data integration, XML access 目录 III 目目 录录 第一章 绪论1 1.1

10、 研究背景.1 1.2 国内外的研究现状.2 1.3 本文的工作和组织结构.6 第二章 XML 及其相关技术8 2.1 XML 的数据模型.8 2.2 DTD和XML Schema.11 2.2.1 DTD 和 XML Schema 简介.11 2.2.2 DTD与XML Schema的比较.14 2.3 XPath、 XQuery 以及 XSLT15 2.4 XML 编程模型16 2.4.1 文档对象模型 DOM16 2.4.2 XML 简单编程接口 SAX17 2.4.3 微软的.NET 框架.18 2.4.4 三种技术的比较19 2.5 XML 的特点.20 第三章 异构数据集成技术简介

11、.22 3.1 异构数据与异构数据库系统.22 3.1.1 异构数据库的特征.22 3.1.2 异构数据库的分类.24 3.2 异构数据集成的相关技术25 3.3 异构数据库集成策略26 3.4 异构数据库主要集成方法与比较27 3.4.1集成方法介绍27 3.4.2 集成方法比较31 3.5 数据集成的数据源异构性问题.33 第四章 XML 模式与关系模式的映射35 基于 XML 的异构数据库数据集成技术的研究 IV 4.1 基于模板驱动的映射.35 4.2 基于模型驱动的映射.36 4.2.1 基于 DTD 模式的映射.37 4.2.2 基于 XML Schema 的映射40 第五章 XM

12、L 访问的新思路及其研究48 5.1 XML 读写的现状48 5.2 读写逻辑模型.49 5.2.1 逻辑构架49 5.2.2 需要考虑的问题.51 第六章 总结与展望.53 参考文献54 致谢.58 攻读学位期间发表的论文及参加的项目.59 第一章 绪论 1 第一章第一章 绪论绪论 1.1 研究背景研究背景 随着数据库技术的不断发展成熟和计算机网络的日益普及, 各领域、 各行业、 各部门都逐步实现了业务、信息的计算机化管理。但是由于各领域、行业和单位 的具体业务与分工的不同,它们根据各自不同的应用需求、业务流程、信息机构 和计算机软硬件环境等特点,构建了大量的不同信息系统。而大部分信息系统的

13、 开发采用了不同的开发工具、不同的操作系统、不同的网络环境、不同的数据库 管理系统如:早期的 dBase、Foxpro 等,现在的 Oracle、Microsoft SQL Server、 Sybase 等等, 其所承载的海量数据大部分即使采用了相同的数据模型但是由于不 同的数据结构、数据类型、不同的表示形式和不同的检索方法等而各有其独特之 处。许多领域,甚至是同一个领域内部所采用的信息化环境,因为拥有了各自的 处理对象、操作方法和专用客户端而形成了一个个“信息孤岛” 。由于历史或其 它原因, 许多企业己拥有多种业务系统, 并且随着市场的变化、 客户需求的变化, 企业还在不断地增加它的应用,导

14、致企业内“信息孤岛”问题越来越严重。 “信 息孤岛”问题在世界各地都已成为一个迫切需要解决的难题。 不断增长的客户以及业务规模使得各行业对实时信息的期望也持续增长, 跨 区域、跨领域的合作已是目前发展的必然趋势。随着网络化与信息化进程的不断 推进, 各领域、 行业和部门的各类信息迫切需要能被最大限度地相互共享、 交换、 集成和再利用。 越来越多的用户希望能够同时访问和处理不同网络节点的多个异 构数据源中的数据,如电信和银行部门的汇总与查询、图书馆馆藏与电子资源的 检索、电子商务和电子政务中不同数据源之间的互操作等,用户希望屏蔽各个层 次的异构特性,不必知道各独立数据库系统的物理分布,也不必知道各物理数据 库的逻辑结构组成,不必进行数据转换与结果汇总,只需通过简单的全局查询便 可得到一个综合结果。 这种各行业对信息共享的需求导致了异构数据源整合技术 的发展,如何有效地实现这些异构数据库的数据集成成为了当前信息建设的重 点。 目前的异构数据库的信息共享建设过于注重各类应用的集成, 而往往忽视与 之紧密相关的另一最基本和最重要问题数据集成。 这样容易导致在应用集成项 基于 XML 的异构数据库数据集成技术的研究 2 目的实施过程中才发现,由于前期的设计未充分考虑到数据集成的需求,使得对 分布在各应用系统中的数据的统一访问和使用有很大的隐患甚至出现错误

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号