基于XML的数据库分析

上传人:cn****1 文档编号:485480903 上传时间:2023-12-23 格式:DOC 页数:12 大小:45KB
返回 下载 相关 举报
基于XML的数据库分析_第1页
第1页 / 共12页
基于XML的数据库分析_第2页
第2页 / 共12页
基于XML的数据库分析_第3页
第3页 / 共12页
基于XML的数据库分析_第4页
第4页 / 共12页
基于XML的数据库分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《基于XML的数据库分析》由会员分享,可在线阅读,更多相关《基于XML的数据库分析(12页珍藏版)》请在金锄头文库上搜索。

1、北华大学计算机科学技术学院数据库原理课程论文基于XML的数据库分析班级:软件8-班小构成员:国娟 李阿雪王丹 张雪李国婧指引教师:胡晓宏12月日基于XL的数据库分析摘要:数据库提供了扩展的功能,可以在XL文档和数据库之间进行数据的传播。一般是设计成为可以存储和提取以数据为中心的文档。一般来说是把文档进行解析后来,存储到相应的表格中,固然,也可以存储以文档为中心的文档,也就是说把整个文档作为一种单一的表中的一种字段,然后通过文本检索机制进行查询。由于许多数据库目前可以把内容发布到网站上,基于XML的数据库和XML服务器之间的差别就变得很模糊。XML自身是不是数据库,从严格的意义上来说,X仅仅意味

2、着XML文档。由于尽管一种XM文档涉及数据,但是如果不通过其她的软件的软件来进行数据解决的话,它自身只但是是一种文本文献。因此XML自身不不能和数据库挂上钩,但是加上某些其她的辅助工具,我们可以把整个M当作是一种数据库系统,L文本自身可以当作是数据库中的数据区,DTD或者Scheas可以当作是数据库模式设计,XQ可以当作是数据库查询语言,SAX或DOM可以当作是数据库解决工具。bstra: e datase rovids expaned ablite t te XL docum and aabases fo data transissin. Usually desigd to b able t

3、o storend reieve ta-ntric docent Gnera it st rseML ument afer the strag t the appropit orm, f oure, canbe sored in th dcuen-centric documnt,which ens the etiredocument asa sngle table n a feld, enth tet eteval mechsm t ea.Becse many database a now able t pubsh to te,baseo the XL dse d XML serverbcom

4、es erlurred te differ. XMLitself snota dataase, omthe strict se, XM simply mens tattM documn Beause, espte an Ldocumencntaning heata, bu if nothouh oe software for dt prceing ftware, tn iselis jutex fi.XM itself dos ot a so the daabaspros i inked,butwithaner of oheruxiliary tools, weca u th etre XM

5、a a aasesysem, XML text iself can b seen as tn he tabase r,DTD or chescnbe seen as is a dataase schem deg, QL abe se as database qurylangage,AX o OMrocesig toolan be viewed a a dataae.核心字:ML 关系型数据库 XML服务器 中间件Keywords: XML relatioal dtabe X server mddleware 引言:我们懂得当存在大量数据需要解决分析的话,最佳是把这些数据放到数据库中,因此几乎所

6、有大型的商业应用系统都是和数据库有关联的,因此如果XML需要在商业领域大展宏图的话,也必须要和数据库相联系。作为一种“数据库”格式,XM有某些优势:例如,它是自描述的(所用的标记描述了数据的构造和类型,尽管缺少语义),可互换的(ortale)(Unicod),可以以树型或图形构造描述数据。同样它也有缺陷,例如,它显得有些繁琐,由于要对它进行解析和文本转换,因此数据访问速度较慢。一种更有用的问题就是在较为宽松的意义上,X及其周边技术与否可以算作“数据库”- 数据库管理系统(DBM)。答案是“在某种限度上是(ort of)”。从正面来说,XML提供了许多数据库所具有的东西:存储(XML文档),模式

7、(DD, XML sche,lAX G 等等), 查询语言(Xr, Xath, XQ, XMQL, QUI等等),编程接口(AX,O,M)等等。从背面来说,它缺少某些作为实用的数据库所应具有的特性:高效的存储,索引,安全,事务和数据一致性,多顾客访问,触发器,在查询多种文献等等。1 XML数据库的发展从初期将XL转换为关系型数据表或大型对象,到今日转向原生XML数据型态,关系型数据库与XM之间的合伙日益紧密。 前X开始起草并向W3C提案,而在199年后成为W3的原则。事隔之后,M已经随着网络应用日益普及,更在WebSevc和SA推波助澜下,可以预见XL的角色将会更形重要。 观测XL的重要发展趋

8、势之一,是ML和关系型数据库的合流。BM甫于6月在美国刊登的新版本数据库B2 9.0,便以原生XML数据型态和存取技术作为改版重点之一。事实上,微软于去年年终推出的SQL ere同样也在XML上下了一番功夫,变化过去将XML转换成关系型数据表的寄存方式,让开发人员可以用XL的措施使用储存在数据库中的X文献或 片段。其他如Oae或Sbase等数据库也都具有在数据库中解决XM的技术和工具。由于XML部分技术仍在审议,因此每家数据库厂商除对原则的 规格支持外,也各自发展不同的实作方式。 2 XM数据库简介如果仅按数据库这个术语的本质来看,XML文献就是数据库,它是数据的集合。在许多方面看起来它和其她

9、文献没什么区别-无论如何,每个文献都具有某种类型的数据。目前XL数据库有三种类型: (1)MLEbeaabs(XEB),即能解决XL的数据库。其特点是在原有的数据库系统上扩大对XML数据的解决功能,使之能适应XL数据存储和查询的需要。一般的做法是在数据库系统之上增长XM映射层,这可以由数据库供应商提供,也可以由第三方厂商提供。映射层管理ML数据的存储和检索,但原始的XML元数据和构造也许会丢失,并且数据检索的成果不能保证是原始的M形式。EDB的基本存储单位与具体的实现紧密有关。 (2)NaieXMDatbase(N),即纯XML数据库。其特点是以自然的方式解决M数据,以XM文档作为基本的逻辑存

10、储单位,针对XML的数据存储和查询特点专门设计合用的数据模型和解决措施。 (3)bridMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XED或ND的数据库,典型的例子是ze。 XM数据库是一种可以在应用中管理XML数据和文档的集合的数据库系统。XL数据库是M文档及其部件的集合,并通过一种具有能力管理和控制这个文档集合自身及其所示信息的系统来维护。M数据库不仅是构造化数据和半构造化数据的存储库,像管理其他数据同样,持久的XM数据管理涉及数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。 目前着重于页面显示

11、格式的L标记语言和基于它的核心词检索等技术已经不能满足顾客日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多种数据源的数据。但困难在于网上数据缺少统一的、固定的模式,数据往往是不规则且常常变动的。因此,ML数据作为一种自描述的半构造化数据为W的数据管理提供了新的数据模型,如果将XML标记数据放入一定的构造中,对数据的检索、分析、更新和输出就可以在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据解决领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析文档的内容。这为数据库研究开拓了一

12、种新的方向,将数据库技术的研究扩展到对eb数据的管理。3XM数据库优势与老式数据库相比,XML数据库具有如下优势: 1、XM数据库可以对半构造化数据进行有效的存取和管理。如网页内容就是一种半构造化数据,而老式的关系数据库对于类似网页内容此类半构造化数据无法进行有效的管理。 2、提供对标签和途径的操作。老式数据库语言容许对数据元素的值进行操作,不能对元素名称操作,半构造化数据库提供了对标签名称的操作,还涉及了对途径的操作。 3、当数据自身具有层次特性时,由于ML数据格式可以清晰体现数据的层次特性,因此XL数据库便于对层次化的数据进行操作。L数据库适合管理复杂数据构造的数据集,如果己经以XML格式

13、存储信息,则XML数据库利于文档存储和检索;可以用以便实用的方式检索文档,并可以提供高质量的全文搜索引擎。此外ML数据库可以存储和查询异种的文档构造,提供对异种信息存取的支持。4 基于XML的数据库产品分类根据RonaldBoure在XML Dataae Prdus一文中的描述,X Dataase中包具有七种类型的产品,分别为: 中间件(Middwre ) 1、 与XML相结合能驱动ML的数据库(XL-nabed atases),例如ralce和微软都宣称在它们最新的数据库产品都都可以和XM进行无缝的衔接。2、 原始的ML数据库(Nati XML Dataase)3、XM服务器(XML See

14、rs)4、 XML应用服务器,例如IM的Wbphere 、 内容管理系统(Content ManagementSystems)下面我们对每一种产品做一种具体的阐明和简介中间件:所谓中间件就是用来在XML文档和数据库之间进行解决和转化的软件。重要应用于以数据为中心的应用里面,它可以用多种各样的语言编写,一般来说它需要用到D,BC,或者是 OLE D. 尽管它可以通过Intenet进行是数据的传播,但是一般它都是通过Web服务器来实现数据的传播。下面我们需要考虑当把M文档存储到数据库中,如何选择适合你应用程序的中间件。事实上,在我们选择中间件的时候,我们要考虑下面某些因素 1数据类型:XML不支持数据类型,也就是说,在XML文档中的所有数据都是文本,虽然数据它自身代表了此外一种数据类型,例如日期或者整数。一般,数据传播中间件将把数据转化为其她类型。 2 二进制数据解决:有两种一般的措施存储XML文档中的二进制数据:未通过解析的实体(unprse entites)和Base4编码。 3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号