《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文

上传人:zhuma****mei2 文档编号:137044924 上传时间:2020-07-04 格式:DOC 页数:62 大小:910.50KB
返回 下载 相关 举报
《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文_第1页
第1页 / 共62页
《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文_第2页
第2页 / 共62页
《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文_第3页
第3页 / 共62页
《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文_第4页
第4页 / 共62页
《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文》由会员分享,可在线阅读,更多相关《《外文翻译--模糊数据表示和XML数据库查询》-公开DOC·毕业论文(62页珍藏版)》请在金锄头文库上搜索。

1、w本 科 生 毕 业 设 计外 文 资 料 翻 译题 目 面向金融OA的日常办公系统办公桌面子系统的设计与实 专 业 计算机科学与技术 班 级 081班 姓 名 指导教师 (讲师) 所在学院 信息科技学院 附 件1.外文资料翻译译文1; 2.外文原文1;3. 外文资料翻译译文2;4.外文原文2 (附件1:外文译文一)International Journal of Uncertainty,Fuzziness and Knowledge-Based SystemsVol. 15, Suppl. (February 2007) 43-57 World Scientific Publishing C

2、ompany模糊数据表示和XML数据库查询EKlN USTUNKAYA and ADNAN YAZICIDepartment of Computer Engineering, Middle East Technical University, 06531, Ankara - TurkeyEmail: ell2925, yazicijceng.metu.edu.trROY GEORGE*Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USAEmail: 真实世界的信息,包括主观的意见和判断,需要不精确数

3、据为蓝本来表示并在数据库中查询。近年来,可扩展标记语言(XML)事实上已经成为数据建模和交流的标准。在XML中,对不精确性的建模和代表这些数据做出的努力没有得到充分发展。本文中,提出了基于XML的模糊数据表示和查询系统。用模糊扩展的XML来表示复杂和不精确的数据。这种表示法形成了一个基础系统,能够在XML文档使用XML的一种查询语言XQuery进行模糊查询。该系统还可以通过XML架构重组,合并XML元素文件。通过使用此功能的系统,应用程序特定的XML架构和XML文件可以从现有的文件中产生。关键字:模糊查询,XML,原生XML数据库。1、简介数据库是数据的一个有组织的集合。传统的数据库管理系统特

4、别适合于代表那些使用标准结构的清晰、明确界定的数据,。然而,现实世界的信息,包括主观的意见和判断,需要复杂和不准确的数据建模同时也需要明确界定的数据。在数据库中代表这种不确定性和复杂的数据仍然是一个正在研究中的问题。扩展非第一范式(ExNF2)1数据模型是一个已为拟议的代表这种不确定和不精确数据模型。可扩展标记语言(XML)2345,被广泛用于数据代表和交换。XML允许内容和表现的分离,也就是说,XML文档简单定义了数据表示但是并不处理它的表现形式。XML可以用来表示复杂和层次性的信息,这是ExNF模型的基本造型结构。 选择最合适的数据库管理系统,以处理基于应用程序和数据结构的XML数据。随着

5、越来越大的数据量作为XML文档表示,有必要有效地存储和查询这些XML文档。在管理XML数据中,原生的XML数据库比传统的数据库管理系统具有几个优点。当数据是半结构化时,映射到一个关系数据库结果中将导致大量的空列(浪费空间)或大量的表(低效的)。另一个在原生XML数据库存储数据的原因是检索速度。原生XML数据库在物理存储数据方面,检索数据比关系型数据库快得多。这是因为原生XML运用存储策略存储整个文件或在文件的各部分中使用物理(而不是逻辑)指针;允许要检索的文件没有连接或存在物理连接,这两者速度都比关系型数据库上的逻辑连接据库快得多11。 几个XML查询语言(如XML- QL的6,XPATH7和

6、XQuery8)已经被XML提出。XML的一个特有优势在于它在代表来自不同来源的信息时具有的灵活性。要利用此灵活性,XML查询语言必须为这些不同来源的信息提供检索和解释功能。XQuery8已被W3C批准作为用于XML查询的标准语言9。 在数据库领域中,传统的查询语言允许在精确的数据的基础上进行数据选择。查询的价值在于能在那些完全满足查询条件和那些不满足条件的地方产生Boolean分区数据。现实世界信息是既复杂又不确切,许多知识密集的应用程序需要使用这些数据10,12,13,14,15,16,17。使用模糊逻辑查询允许用户自定义软目标和约束,并向用户提供查询数据的相对重要性。 本文中,我们介绍了

7、将复杂和不确定的数据映射到XML代表的方法。这项研究的动机是为了在XML文档中的结合模糊和不确定的数据代表处理ExNF数据模型性并推广XML数据库系统的使用。 XML的结构非常类似于关系数据库元组,因此,将INF文件的元组映射到XML元素是很简单的1819。然而,ExNF模型1介绍的是经扩展的,较复杂的,不确定的和模糊的数据,不容易用XML表示。在这项研究中,XML文档适用于ExNF2模型的格式,包括代表不精确、复杂性数据的元素和属性。我们使用这些概念,开发一个系统,允许在XML文档中进行模糊查询。系统中XML文档的概念通过模糊属性得到扩展。除了模糊查询,系统可通过合并XML文档的元素重组XM

8、L架构。通过使用此功能的系统,特定的XML Schema应用程序和XML文档可从现有的文件中产生。要查询的XML文档在原生XML数据库管理系统塔米诺20中存储。本文的组织构架如下:第2节将描述以XML为基础的模糊查询系统的设计。第3节将描述在实施这项研究中所做的细节性工作。最后,第4节作出结论总结。2、基于XML的模糊查询系统的设计 本节中,我们首先提出包括在这项研究中的模糊和其他不确定属性的定义以及它们的XML表示。参考模型是ExNF数据库模型1。2.1系统目标 这项研究的主要目标是开发一个系统,它通过使用由非第一扩展范式(ExNF2)1的扩展介绍,在XML中,为现实世界的数据提供了一个模型

9、。在XML数据中执行模糊查询,并允许XML模式转型。该系统应以图形用户界面提供用户构建模糊查询和XML重组架构。2.2复杂和不确定的数据建模 本节引入在ExNF模型1中介绍的属性类型的定义以及在属性类型的XML表示。在ExNF模型中属性类型的介绍包括原子,空值,设定值,关系值,模糊值,范围值属性以及XML表示形式的基础。2.2.1在ExNF数据模型中不确定性的代表 在数据库中不确定性可以通过扩展的嵌套关系2122代表而非INF数据模型23,24,25。扩展模型,即扩展非第一范式(ExNF)1,在数据库中提供包括不确定性的扩展是必要的。 ExNF关系可以定义如下1:定义:定义Sch R是一个与属

10、性R相关的属性(A1,A2,An)。每个属性Aj可能是简单的设定值,模糊值,范围值或关系值,如下文定义。假设D1, D2,Dn是有限域设置。使e,R的一个实例,组成一套有序的形式 ,这是(D1 x D2xx Dn)的一个子集。Dj(1jk)的域,可以是以下内容中的一个:(1) Dj是一个原子值属性域。每个值Aj是Dj的一个元素;也就是说,它是一个典型的简单明确界定的属性值。(二)Dj是一个空值的属性域。域名Dj组成了明确定义的值a1,a2,,an可以扩展到域Dj= DjU unk,dne,ni。(三)Dj是一个不完整(范围)值的属性,其值可以是原子或一个区间。区间表示为aj1 - aj2,其中

11、aj1为最小值,aj2是范围的最大值。这两个值都取自域Dj。(四)Dj是一个模糊值属性域。域包含了一组模糊集语言。一个模糊的属性值是一个非空子集的Dj和aj1,aj2,ajm的代表。(五)Dj是集值属性域,其值代表明确界定的集aj1, aj2,ajm。任何这个属性的值都是Dj的一个子集。(六)Dj是关系值(复合)属性域。这个属性的任何值,Aj,是一个元组的形式,这是(Dj1 x Dj2xxDjm)的一个元素,其中1 m并且1jk。 当Dj是一个关系值(复合)设置属性域时,其中每个Aj值是,的一个元组,这是(Dj1x Dj2 x xDjm)的一个子集,可以通过关系值和设定值的组合来形成这种属性。

12、定义:假设R和S是Rel A和Att A中的属性,且是dom中存在的常数。在这里使用的类型比那些关系数据模型更复杂。他们的抽象语法为: x = dom| fdom| ndom| idom|(B1:x1,Bm :xm)|xs, 其中xsfdom| idom|X且B1,Bm是截然不同的属性。直观地看,一个元素dom是一个常数(传统的明确界定的原子属性),fdom是一个模糊值排序属性(可能形成一个集或语义)v1,vm的形式,其中vj是dom的一种并且是任何本集的子集元素;ndom是unk,dne,ni,x一个空值的排序属性形式,其中x排序dom; idom是v1 - vj的一个排序不完整的形式,vj

13、的排序dom和元素是vj,v1 vivj;(B 1:x1,Bm:xm)的排序元素是K元组在Bj的排序xi的一个元素,1im;排序元素xi是排序X的一个有限集合元素。定义:从形式上看,排序x的值(即x的解释),记为t x,定义如下:(一)t dom = dom,(二)tfdom= v1, vj |Vi:1 i j:vitdom,(三)t ndom= vi | Vi:1i j:vitunk,dne,nidom,(四)tidom= v1 - vj | Vi:1 i j:v1vivj,vitdom,(五)txs=v1,vj | Vi,j:1ij:vit xs。如果txs = ,那么vi = dne,(

14、六)t (B1:x1,Bm:xm) = (B1:x1,Bm:xm) | Vi:1im:Vit xi。 R由关系名和数据库架构的关系名称的有限集合组成。关系名称R的一种关系是有限排序值(R)。比如I的架构R是R的函数,在这里I是R关系的实例。当关系R有一个排序,即(R)=(B1:x1,Bm:xm),这种关系由元组组成,其中每个xi可能是上述给出的解释之一。2.2.2.在XML中表示不确定性 XML文档是一个由逻辑结构(由文档对象声明,注释,字符引用,元素,和处理指令构成),和物理结构(由实体,开始的根,或文档实体组成)构成的。每个元素都有一个类型,有名称标识,并且可能有一组属性规范。属性规范有相应的名称和值。XML架构的元素有两种主要类型:简单的和复杂的。简单的元素内他们定义为零属性和零元素,而复杂元素的定义允许有一个或多个属性或一个或多个元素。复杂的因素可能会进一步归类为:空元素,只包含其他元素的元素,只

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号