研究基于扩展XQuery引擎的空间数据流查询方法

上传人:l****6 文档编号:38057347 上传时间:2018-04-26 格式:DOC 页数:5 大小:33KB
返回 下载 相关 举报
研究基于扩展XQuery引擎的空间数据流查询方法_第1页
第1页 / 共5页
研究基于扩展XQuery引擎的空间数据流查询方法_第2页
第2页 / 共5页
研究基于扩展XQuery引擎的空间数据流查询方法_第3页
第3页 / 共5页
研究基于扩展XQuery引擎的空间数据流查询方法_第4页
第4页 / 共5页
研究基于扩展XQuery引擎的空间数据流查询方法_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《研究基于扩展XQuery引擎的空间数据流查询方法》由会员分享,可在线阅读,更多相关《研究基于扩展XQuery引擎的空间数据流查询方法(5页珍藏版)》请在金锄头文库上搜索。

1、1研究基于扩展 XQuery 引擎的空间数据流 查询方法摘要:针对目前 XML 数据流处理中通常采用的查询语言 XPath 和XQuery 均不支持空间运算,无法应用到空间数据流处理技术中的问题,设计了一种通过扩展现有商业化 XQuery 引擎功能基础上的空间数据流检索方法。 关键词:可扩展标记语言数据流;XQuery;空间数据 随着 Web 应用中数据交换越来越频繁,产生了大量不间断的数据流。由于XML 已经成为 Internet 环境中数据表示和交换的标准,数据流大量以 XML 格式表现。如何从不间断的 XML 数据流中匹配、抽取和转换部分数据流以满足商务应用的需求成为当前国际数据库领域的

2、一个研究热点。目前针对 XML 数据流的处理研究有很多,但研究的对象均是普遍意义上的 XML 数据流,对于以 XML 格式表现的空间信息及查询中需要空间关系运算的数据流处理研究较少。研究如何在目前的 XML 数据流处理中支持空间运算有着重要意义。 1 存在的问题 在目前针对 XML 数据流的研究中,其基本思想都是将用 XPath 表示的查询表达式转换为状态树型自动机,处理程序以流的方式接收并处理 XML 文档,看其满足哪一个状态节点的要求以触发查询匹配操作。如果满足所有状态节点的要求,则向用户返回相关的文档或结果1。由于 XPath 表达复杂查询的局限性,W3C 制定了专门针对 XML 的查询

3、语言规范 XQuery。XQuery 语言的核心是 XPath 和FLWOR(for、let、where、orderby 和 return)表达式,复杂的 XQuery 查询语句很难2用合适的状态机来表达。将 XQuery 直接改造成 XML 数据流的查询语言也引出了大量研究25。目前标准的 XPath 和 XQuery 规范均不支持空间数据类型及空间运算,且空间分析功能算法复杂。通过这些规范自身的数据类型定义和基本函数库来实现复杂空间数据类型以及空间分析功能的扩展很困难,使得这些研究很难应用到包含空间运算的数据流查询中。要在 XML 数据流查询中支持空间运算,需要先扩展 XQuery 规范以

4、支持空间数据操作函数。自定义实现支持空间运算的XQuery 引擎是理想的方法。文献6,7中已提出了直接扩展 XQuery 以支持空间功能的方法。但自定义实现 XQuery 引擎需要完整的词法分析、语法分析、查询规范化以及翻译执行等,使得这些方法均停留在理论阶段,很难实际应用。 针对这些问题,本文设计了一种在商业化引擎基础上扩展 XQuery 空间功能的方法,然后以事件流处理方式接收 XML 文档以实现空间数据流查询的方法。 2XQuery 引擎空间功能的扩展 扩展 XQuery 引擎以支持空间运算,除了自定义实现支持空间运算的 XQuery引擎方法外,还可以利用现有的 XQuery 引擎进行扩

5、展。目前的商业化 XQuery 引擎均提供使用外部函数的功能扩展方法,如目前知名的商业化 XQuery 引擎Saxon 提供的功能扩展机制可以允许在 XQuery 查询语句中调用 Java 或 .NET 方法作为外部函数。其使用方法简单,只需要在 XQuery 查询语句中声明外部函数所在的名称空间就可以调用外部方法。这为 XQuery 引擎实现包括空间分析的查询提供了便捷的途径。 21 空间数据类型的表达方法 采取调用外部方法来扩展 XQuery 引擎的功能,不可避免地会产生空间数据作3为参数传递的问题。以采用 Java 语言实现扩展方法为例。虽然容易用 Java 对象表达各种空间数据类型,但

6、由于 XQuery 引擎规范本身不支持直接以 Java 对象表达的空间数据类型,为了使 XQuery 语句中支持空间数据类型并能够使空间数据在Java 类和 XQuery 引擎中传递,需要找到一种合适的空间数据表达方法。 GML 是一个用 XMLschema 描述的 XML 语法,用来进行空间和非空间的地理信息建模、传输和存储。GML 已成为 Web 应用中所接受并容易理解的一种空间信息的交换格式。由于 GML 文档本身也是一个 XML 文档,可以用 DOM 对象document 来表达,在 Saxon 的 XQuery 实现中能够支持 DOM 对象的传递,采用GML 表达空间数据以支持空间数

7、据在 XQuery 引擎与外部 Java 类之间的传递成为自然的选择。将 GML 在 XQuery 引擎与外部方法之间进行传递,需要引入GML 的 schema 描述。在 GML 规范中,feature.xsd 定义了抽象地理特征模型,geometry.xsd 定义了具体的几何形状信息,提供了点(point)、线(line)、多边形(polygon)、点集(multipoint)、线集(multiline)和多边形集(multipolygon)等基本几何图形以及复合类型(complextype)的几何图形。在本方法中只用到了空间数据类型的几何定义,所以引入 geometry.xsd 即可。在

8、XQuery 语句中定义如下: importschemanamespaceGML=“http:/ at“geometry.xsd“; 引入 GML 的 schema 后,可以将 GML 进行描述的空间变量定义为 schema 限制的 element 变量作为参数进行传递,定义如下: Let $p=doc(test.xml)/schemaelement(GML:linestring) 22 空间功能的扩展 定义了空间数据的表达方式后,对空间运算功能的实现在外部方法中进行。参照文献6中定义的空间方法,本文定义了 SPATIAL 类封装,实现了部分空间方法。由于 Saxon 的 XQuery 实现中

9、,支持对 Java 类的静态方法调用以及实例化对4象方法调用,但对于需要实例化对象的方法调用相对复杂。为了方便调用,所有空间方法均定义为 SPATIAL 类的静态成员方法。定义如下: publicclassSPATIAL publicstaticbooleanWithIn(Documenta,Documentb) publicstaticbooleanToughes(Documenta,Documentb) publicstaticbooleanCrosses(Documenta,Documentb) 实现了上述定义空间方法后,通过该类就可以扩展 Saxon 的 XQuery 引擎。扩展方法很

10、简单,只需在 XQuery 语句中声明该空间类的名称空间,在查询语句中需要空间运算的地方调用该类的各种方法即可。比如要使用空间包含的方法,先声明名称空间:declarenamespaceSPATIAL=“java:myclass.SPATIAL”;然后只需在调用方法前加入名称空间即可,如 SPATIAL:Disjoin()。 另外需要注意的是,如果扩展的方法返回值不是简单数据类型则需要进一步处理。本文方法只是返回空间的包含相交等关系是否为真,是简单的布尔类型,不需要进一步处理。 3 基于扩展引擎的空间数据流查询方法 扩展后的 XQuery 引擎可以处理带有空间信息的 XML 文档。但由于目前的

11、XQuery 引擎通常被设计来处理在内存中装配好的源 XML 文档,对于动态的数据流而言无法直接处理。为了能够对空间数据流进行处理,还需要借助SAX(simpleAPIforXML)之类基于事件的 XML 解析程序辅助处理,以避免在采取操作之前需要存储文档的所有内容。 本文原文 SAX 是事件驱动的 XML 处理器,允许正在读取 XML 文档时处理该文档。文档的读入过程也就是 SAX 的解析过程。其触发的事件主要包括:startDocument 表示文档开始;endDocument 表示文档结束;startElement 表示元素开始;endElement5表示元素结束;characters

12、表示字符数据。将 SAX 与 Saxon 组合处理以 XML 格式表达空间数据流时,需要在相应的事件处理程序中调用 XQuery 查询语句。以一简单的物流监控为例,监控中心希望监控车辆在某指定时段内的指定区域的行驶是否符合预设路线。假设车辆每隔 5min 将该时段内的行驶轨迹及状态信息以XML 文档格式形成不间断的数据流发送给监控中心。其数据格式 DTD 定义如下:xsd:complexTypename=“DTStateHistory“ xsd:elementname=IDtype=“xsd:Integer“ xsd:sequence xsd:elementname=“StateUnit“ty

13、pe=“DTstateUnit“minOccurs= “1“maxOccurs=“unbounded“/ /xsd:sequence /xsdcomplexType xsd:complexTypename=“DTStateUnit“ xsd:elementname=“Time“type=“xsd:Date“/ xsd:elementname=“Position“type=“GML:Point“/ (其他必要属性信息) /xsdcomplexType 用 SAX 和 Saxon 组合处理该数据流,当数据流不断到达时,SAX 处理程序监听数据流并触发相应的事件。在元素 DTStateHistory

14、 的 endElement 事件到达时,将该段数据流转换为 XML 文档存入内存,以 DOM 数据类型表示作为 Saxon 引擎的数据源,由 Saxon 引擎执行预先设定的查询语句。查询的 XQuery 语句如下: declarenamespaceSPATIAL=“java:myclass.SPATIAL“ declarevariable $RouteasGML:MultiLineStringexternal 6for $StateUnitindatasource(“cachedatastream“)/DTStateHistory/StateUnit let $p= $StateUnit/sc

15、hemaelement(GML:point) wherefn:timeWithin( $StateUnit/Time,Duration)andSPATIAL:Disjoin( $p, $Route) returnalerttime $StateUnit/Time/alerttime alertPosition $p/alertPosition 该查询语句检索存放在缓存中的 XML 文档,并将位置信息封装到一个element 作为参数与设定的路径进行匹配。匹配工作由外部的 SPATIAL 类的Disjoin 方法完成。如果该点不在预订路线上则返回该点的时间和位置信息到新的 XML 文档。随着事件

16、的不断触发,程序不断缓存数据并调用该语句进行处理,实现对数据流的处理。 4 结束语 本文研究了一种处理 XML 空间数据流的方法。该方法通过先扩展 XQuery 引擎的空间运算功能,然后结合 XML 流式处理方法对空间数据流进行处理,为空间数据流的查询和检索提供了一种简便的途径。在今后的工作中将扩展数据关联分析及趋势分析等数据挖掘等功能,结合 XML 数据流挖掘技术的研究,研究基于 XQuery 的空间数据流挖掘方法。 参考文献: 1高军,杨冬青,唐世渭,等.基于树自动机的 XPath 在 XML 数据流上的高效执行J.软件学报,2005,16(2):223-232. 2 KOCHC,SCHERZINGERS,SCHWEIKARDTN, etal .Schemabasedschedulingofe ventprocessorsandbufferminimizationforquerie

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号