基于XML的数据库分析

上传人:mg****2 文档编号:122017457 上传时间:2020-02-29 格式:DOC 页数:12 大小:55.50KB
返回 下载 相关 举报
基于XML的数据库分析_第1页
第1页 / 共12页
基于XML的数据库分析_第2页
第2页 / 共12页
基于XML的数据库分析_第3页
第3页 / 共12页
基于XML的数据库分析_第4页
第4页 / 共12页
基于XML的数据库分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《基于XML的数据库分析》由会员分享,可在线阅读,更多相关《基于XML的数据库分析(12页珍藏版)》请在金锄头文库上搜索。

1、北华大学计算机科学技术学院数据库原理课程论文基于XML的数据库分析班级:软件08-2班小组成员:国娟 李阿雪 王丹 张雪 李国婧指导教师:胡晓宏基于XML的数据库分析摘要:数据库提供了扩展的功能,能够在XML文档和数据库之间进行数据的传输。通常是设计成为能够存储和提取以数据为中心的文档。一般来说是把XML文档进行解析以后,存储到相应的表格中,当然,也可以存储以文档为中心的文档,也就是说把整个文档作为一个单一的表中的一个字段,然后通过文本检索机制进行查询。因为许多数据库现在能够把内容发布到网站上,基于XML的数据库和XML服务器之间的差别就变得很模糊。XML本身是不是数据库,从严格的意义上来说,

2、XML仅仅意味着XML文档。因为尽管一个XML文档包含数据,但是如果不通过其他的软件的软件来进行数据处理的话,它本身只不过是一个文本文件。所以XML本身不不能和数据库挂上钩,但是加上一些其他的辅助工具,我们可以把整个XML看成是一个数据库系统,XML文本本身可以看成是数据库中的数据区,DTD或者Schemas可以看成是数据库模式设计,XQL可以看成是数据库查询语言,SAX或DOM可以看成是数据库处理工具。Abstract: The database provides expanded capabilities to the XML documents and databases for dat

3、a transmission. Usually designed to be able to store and retrieve data-centric document. Generally it is to parse XML documents after the storage to the appropriate form, of course, can be stored in the document-centric document, which means the entire document as a single table in a field, then the

4、 text retrieval mechanism to search. Because many databases are now able to publish to the site, based on the XML database and XML server becomes very blurred the difference. XML itself is not a database, from the strict sense, XML simply means that the XML document. Because, despite an XML document

5、 containing the data, but if not through other software for data processing software, then it itself is just a text file. XML itself does not and so the database process is linked, but with a number of other auxiliary tools, we can put the entire XML as a database system, XML text itself can be seen

6、 as data in the database area, DTD or Schemas can be seen as is a database schema design, XQL can be seen as a database query language, SAX or DOM processing tools can be viewed as a database. 关键字:XML 关系型数据库 XML服务器 中间件Keywords: XML relational database XML server middleware 引言:我们知道当存在大量数据需要处理分析的话,最好是

7、把这些数据放到数据库中,所以几乎所有大型的商业应用系统都是和数据库相关联的,所以如果XML需要在商业领域大展宏图的话,也必须要和数据库相联系。作为一种“数据库”格式,XML有一些优势:例如,它是自描述的(所用的标记描述了数据的结构和类型,尽管缺乏语义),可交换的(portable)(Unicode),能够以树型或图形结构描述数据。同样它也有缺点,例如,它显得有些繁琐,由于要对它进行解析和文本转换,所以数据访问速度较慢。一个更有用的问题就是在较为宽松的意义上,XML及其周边技术是否可以算作“数据库” - 数据库管理系统(DBMS)。答案是“在某种程度上是(sort of)”。从正面来说,XML提

8、供了许多数据库所具备的东西:存储(XML文档), 模式(DTD, XML schema,RElAX NG 等等), 查询语言(XQuery, XPath, XQL, XML-QL, QUILT等等),编程接口(SAX, DOM,JDOM)等等。从反面来说,它缺少一些作为实用的数据库所应具备的特性:高效的存储,索引,安全,事务和数据一致性,多用户访问,触发器,在查询多个文件等等。1 XML数据库的发展从早期将XML转换为关系型数据表或大型对象,到今日转向原生XML数据型态,关系型数据库与XML之间的合作日益紧密。 10年前XML开始起草并向W3C提案,而在1998年后成为W3C的标准。事隔10年

9、之后,XML已经随着网络应用日益普及,更在Web Services和SOA推波助澜下,可以预见XML的角色将会更形重要。 观察XML的重要发展趋势之一,是XML和关系型数据库的合流。IBM甫于6月在美国发表的新版本数据库DB2 9.0,便以原生XML数据型态和存取技术作为改版重点之一。事实上,微软于去年年底推出的SQL Server 2005同样也在XML上下了一番功夫,改变过去将XML转换成关系型数据表的存放方式,让开发人员可以用XML的方法使用储存在数据库中的XML文件或 片段。其它如Oracle或Sybase等数据库也都具备在数据库中处理XML的技术和工具。由于XML部分技术仍在审议,因

10、此每家数据库厂商除对标准的 规格支持外,也各自发展不同的实作方式。 2 XML数据库介绍如果仅按数据库这个术语的本质来看,XML文件就是数据库,它是数据的集合。在许多方面看起来它和其他文件没什么区别 - 无论如何,每个文件都含有某种类型的数据。目前XML数据库有三种类型: (1)XMLEnabledDatabase(XEDB),即能处理XML的数据库。其特点是在原有的数据库系统上扩充对XML数据的处理功能,使之能适应XML数据存储和查询的需要。一般的做法是在数据库系统之上增加XML映射层,这可以由数据库供应商提供,也可以由第三方厂商提供。映射层管理XML数据的存储和检索,但原始的XML元数据和

11、结构可能会丢失,而且数据检索的结果不能保证是原始的XML形式。XEDB的基本存储单位与具体的实现紧密相关。 (2)NativeXMLDatabase(NXD),即纯XML数据库。其特点是以自然的方式处理XML数据,以XML文档作为基本的逻辑存储单位,针对XML的数据存储和查询特点专门设计适用的数据模型和处理方法。 (3)HybridXMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XEDB或NXD的数据库,典型的例子是Ozone。 XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能力管理和

12、控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。 当前着重于页面显示格式的HTML标记语言和基于它的关键词检索等技术已经不能满足用户日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多个数据源的数据。但困难在于网上数据缺乏统一的、固定的模式,数据往往是不规则且经常变动的。因此,XML数据作为一种自描述的半结构化数据为Web的数据

13、管理提供了新的数据模型,如果将XML标记数据放入一定的结构中,对数据的检索、分析、更新和输出就能够在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据处理领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析XML文档的内容。这为数据库研究开拓了一个新的方向,将数据库技术的研究扩展到对Web数据的管理。3 XML数据库优势与传统数据库相比,XML数据库具有以下优势: 1、XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。 2、提供对标签和路径的操作

14、。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。 3、当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。4 基于XML的数据库产品分类根据Ronald Bourret在XML Database Products一文中的

15、描述,XML Database中包含有七种类型的产品,分别为: 中间件(Middleware ) 1、 与XML相结合能驱动XML的数据库(XML-Enabled Databases),比如Oralce和微软都宣称在它们最新的数据库产品都都能够和XML进行无缝的衔接。2、 原始的XML数据库(Native XML Database)3、 XML服务器(XML Servers)4、 XML应用服务器,比如IBM的WebSphere 5、 内容管理系统(Content Management Systems)下面我们对每一种产品做一个具体的说明和介绍中间件:所谓中间件就是用来在XML文档和数据库之间

16、进行处理和转化的软件。主要应用于以数据为中心的应用里面,它可以用各种各样的语言编写,一般来说它需要用到ODBC, JDBC,或者是 OLE DB. 尽管它可以通过Internet进行是数据的传输,但是一般它都是通过Web服务器来实现数据的传输。下面我们需要考虑当把XML文档存储到数据库中,如何选择适合你应用程序的中间件。实际上,在我们选择中间件的时候,我们要考虑下面一些因素 1 数据类型: XML不支持数据类型,也就是说,在XML文档中的所有数据都是文本,即使数据它本身代表了另外一种数据类型,比如日期或者整数。通常,数据传输中间件将把数据转化为其他类型。 2 二进制数据处理:有两种通常的方法存储XML文档中的二进制数据:未经过解析的实体(unparsed entities)和Base64

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号