基于web服务异构数据库智能集成的研究

上传人:xins****2008 文档编号:113491353 上传时间:2019-11-08 格式:DOC 页数:12 大小:39.50KB
返回 下载 相关 举报
基于web服务异构数据库智能集成的研究_第1页
第1页 / 共12页
基于web服务异构数据库智能集成的研究_第2页
第2页 / 共12页
基于web服务异构数据库智能集成的研究_第3页
第3页 / 共12页
基于web服务异构数据库智能集成的研究_第4页
第4页 / 共12页
基于web服务异构数据库智能集成的研究_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《基于web服务异构数据库智能集成的研究》由会员分享,可在线阅读,更多相关《基于web服务异构数据库智能集成的研究(12页珍藏版)》请在金锄头文库上搜索。

1、基于Web服务异构数据库智能集成的研究 id=“artibody”【摘 要】针对当前多源异构数据库信息交换和集成办法的不足,本文提出了基于Web服务分布式异构数据库中间件的智能集成方法。首先介绍一种基于B/S三层架构的异构数据库集成系统及其优势,然后阐述该模型各组件的功能和数据模式映射,最后利用Spring 框架的Quartz定时任务调度实现集成系统的智能更新,通过实验验证了该系统的可行性和有效性。【关键词】XMLWeb服务;异构数据库;中间件0 引言随着计算机的和信息系统的发展,计算机网络与数据库的关系日益紧密,很多企业的部门根据自身业务和功能需要,建立了许多相互隔离的异构数据源,但由于缺乏

2、统一的信息规划,各信息管理系统开发时间和来源不一致,采用的开发平台、数据结构和数据库管理系统也各不相同,造成了各系统间相互独立,信息无法互联互通,逐渐形成了“信息孤岛”3。传统的分布对象技术分别有OMG的CORBA、 Microsoft的DCOM 以及SUN的RMI。然而CORBA缺少方便的开发工具和强有力的厂商支持,门槛稍高,入门较困难;DCOM 跨平台性较差;RMI对多语言融合的支持却很弱。同时,这几种技术都有相似的缺陷:CORBA、DCOM和RMI虽然能调用实现的系统,但均要求服务器和客户端必须紧密耦合,并且体系结构相同;CORBA、DCOM和RMI依赖于特定的对

3、象模型协议,目前只在企业内部使用广泛,都不太适合在Internet环境下进行多源异构数据库融合的设计开发。Web服务的出现满足了信息化服务所要求的基本功能,它是微软.NET 框架下多源异构应用的典型方案,并在中间件基础上,采用XML和Web服务技术实现了各异构数据库的融合,提供了一种全新的以松耦合的方式在Internet环境下部署分布式应用的解决方案。任何操作系统、任何语言编写的客户端都能够访问服务器提供的Web服务,其客户端与服务器端之间以XML消息作为联系,解决异构数据库集成的难题,弥补了CORBA、DCOM和RMI方法的不足。本文提出的基于Web服务分布式异构数据库B/S三层架构的智能集

4、成方法优化了传统的集成方法和数据模式映射,同时还利用Spring 框架的Quartz定时任务调度实现集成系统的智能更新,整个系统具有实时性、可扩展性、高响应性等特点。本文的第二部分介绍Web服务和异构数据库系统,第三部分提出基于Web服务的分布式异构数据库集成系统总体架构和各功能模块,第四部分对描述系统设计与实现,第五部分进行测试验证,第六部分对本文进行总结。1 相关理论与技术概述1.1 Web服务体系结构Web服务是一种面向服务的分布式计算体系结构,相比传统的分布对象技术和集成技术,能够提供面向Internet的标准程序接口,具有跨防火墙、软件和数据重用、良好的封装性、松散耦合性和高度可集成

5、性等优点4。Web服务作为一个新型的分布式计算模型,具有自包容和自描述的优点。由三个角色和三个操作组成。三个角色分别为服务提供者、服务请求者和服务代理,三个操作为发布、查找和绑定。Web服务的关键技术包括SOAP(Simple Object Access Protoco1)、WSDL(Web Service Description Language)、UDDI(Web Service Description Language)、XML。XML是Web服务的技术基础,Web服务中各种信息的描述都是基于XML。SOAP提供了一种通信机制,它是分布式环境中交换信息的通用协议,保证了Web服务和其它应

6、用程序之间可靠通信;WSDL是以XML的格式来描述Web服务。UDDL用来创建Web服务注册中心,它是Web服务注册和发现的技术规范6。Web服务体系结构如图1。1.2 异构数据库图1 Web服务结构异构数据库实现数据共享的同时,每个数据库系统保持着自己的完整性、自治性和安全性。异构数据库系统中的异构性主要表现为数据异构、系统异构和语义异构5。(1)数据异构。异构数据库系统中数据异构表现在不同数据源对同一数据有不同的定义,例如格式、数据类型或精度等等。比如在SQL Server中用int、float、double等类型,而在Oracle中用Number统一表示数值型的属性。因此在异构数据库之间

7、共享数据时,需要对数据异构加以考虑。(2)系统异构: 异构数据库系统中系统异构主要指数据所依赖的应用系统存在的差异,比如硬件平台(大型机、PC机)、数据库管理系统(MySQL、SQL Server) 和操作系统(Unix、Windows)等的不同。(3)语义异构: 语义异构是指属性含义相同,但是属性名的接口模式不同。从简单的命名冲突(如同名异义,同义异名)到复杂的结构语义冲突,语义异构在数据库中主要表现在属性异构。比如属性“姓名”,有的用“Name”,也有的用“XingMing”,属性名“type”

8、,有的表示车型,也有的表示食物类型等。数据库的语义异构是数据集成过程中需要解决的关键问题。1.3 异构数据库集成的常用技术异构数据集成的常用技术为:联邦数据库、数据仓库和中间件方式。(1)联邦数据库采用模式集成的方法,其基本思想是在数据库系统集成时,从各异构数据库中获取数据源的数据视图,并将其集成为全局模式。用户就可以直接通过全局模式透明地访问各数据源中的数据。各数据源间互相独立,通过数据转换接口实现相互访问。联邦数据库优点是容易操作实现,缺点是当异构数据源变化时,种类复杂,工作量大,扩展性差,仅适合数据源较少的情况下使用8。(2)数据仓库概念始于上世纪 80 年代中期,其基本思想是将各个数据

9、源的数据复制到同一数据仓库中,用户可以直接访问数据仓库进行集中查询获取数据。数据仓库优点是便于控制,容易处理,缺点是当数据信息重复存储时,无法将数据源的更新信息及时准确地反映到数据仓库中。数据仓库仅适合数据源比较稳定,并且数据访问较频繁的情况,不适合于用户实时查询。(3)基于中间件的数据集成模式是目前最典型的数据集成方法。中间件由中介器(Mediator)和包装器(Wrapper)组成。中间件方式并不改变数据原来的存储方式和位置,它为异构数据源提供一个统一的虚拟视图7。中间件模型适用于变化频繁、结构多样且数据源较多的情况。本文的系统结构就是采用中间件的方式。 id=“artibody”2 基于

10、Web服务的分布式异构数据库数据集成系统2.1 用户需求分析在该异构数据查询系统中,共有三种用户参与,分别是各异构数据库管理员、集成系统管理员和普通用户。其中集成系统管理员享有最高权限,可以创建和管理用户、审查和批准需要加入的异构数据源、获取异构数据源的元数据、合成并管理全局数据库模式等;各异构数据库管理员能够登陆数据源注册系统,根据需要填写注册信息,选择需要共享的表和字段并注册;普通用户只能登陆查询系统,根据相关的查询权限对数据进行查询。系统用户如图 3所示。图 2 系统用户2.2 体系结构Web服务集成中间件系统体系自下而上包括数据库层、数据集成层和统一应用层。其中,底层的各个异构数据源构

11、成了系统的数据库层;数据集成层采用中间件技术,封装了异构数据库集成系统的业务逻辑;各种应用程序和对应的访问接口构成了系统的统一应用层。数据库智能集成系统框架图如图2所示。图3 基于Web服务的分布式异构数据库智能集成系统框架图该系统采用 B/S模式,构成了客户/服务器三层架构。采用这种设计有以下几种优势:(1)安装升级简便。通过浏览器访问数据库简化了客户端。在升级软件的时候,不需要对客户端升级。(2)易扩展维护。所有应用程序均在服务器端,开发维护过程可集中在服务器端,不需要考虑数据库端和客户端。(3)可移植性强。本文采用JavaBean技术,可以在不同Web服务器、不同操作系统上运行,而且可以

12、在不同的平台间移植,不需要重新编译。(4)可靠性强。多层体系结构可以有效地优化系统总体性能,提高系统的可靠性和伸缩性。(5)数据智能更新快。综合包装器中的智能更新模块采用Spring框架,该方法中Quartz任务定时扫描更新各异构数据库上传的XML描述文档,充分保证了抽象数据表的实时性、智能性和有效性。2.3 功能模块设计(1)客户端功能模块统一应用层也就是用户界面,即异构数据库集成系统的使用者。用户可以通过数据集成层来访问异构数据库的共享数据资源。本系统不需安装客户端软件,直接利用浏览器作为客户端用户的界面,可以把XML表示的数据转换成为Html格式,直观方便,非常适合异构数据集成系统8。(

13、2)服务器端功能模块本文采用Tomcat作为Web服务器。Tomcat作为一个优秀的开源Web应用服务器,是Apache Jakarta的子项目之一。其性能稳定、技术先进,而且免费开源,因而深受软件开发商和Java爱好者的认可,Web应用服务器目前使用广泛。数据库服务器主要是提供实际的数据管理功能,为数据站点存储数据集。该系统主要支持的数据库服务器有Oracle、SQL Server、MySql、Access 等。(3)数据模式转换功能模块数据集成层是实现异构数据库中数据转换的核心,目的是访问各个数据源,集成数据源信息,协调各数据源间信息。数据集成层在各局部数据提供的共享数据的基础之上建立一个

14、全局的虚拟视图,并不存储实际的数据。具体包括:元数据DB、元数据管理器、综合包装器、中介器、应用层访问统一接口、异构数据库统一接口,下面分别对各模块加以介绍。元数据DB负责储存各异构数据库的元数据库信息。元数据库信息包括注册信息、连接信息URL、各元数据库用户与全局用户的匹配关系、模式映射信息、访问策略信息等。元数据DB支撑整个系统的运行9。元数据管理器负责制定集成系统的全局模式与局部数据库的模式之间的转换规则。中介器负责异构数据库的注册、公共模型的生成和全局查询请求的接收。中介器由三个组件构成,包括:异构数据注册模块、查询规划模块和结果合并过滤模块。其中,异构数据注册模块的主要功能是:在共享

15、数据注册阶段,负责公共模型的建立以及异构数据库的共享注册;查询规划模块的主要功能是:在数据集成阶段,将客户端提交的基于全局数据库的标准查询分解成针对各个异构数据库的子查询,并提交到相应的包装器;结果合并过滤模块的主要功能是:将各异构数据库查询返回的 XML文档进行合并,形成完整统一的查询结果,反馈至客户端浏览器。综合包装器的功能是实现数据位置和访问的透明,对异构的数据进行包装。综合包装器由智能更新模块、查询结果转换模块和数据库操作模块三个组件构成。智能更新模块采用spring框架的quartz任务定时的扫描由不同的异构数据库上传的XML描述文档,通过解析这些XML文档,实现数据自动更新,从而保证抽象数据表的有效性、实时性、智能性。查询结果转换

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号