OrientX3.0及其改进之处

上传人:m**** 文档编号:569171187 上传时间:2024-07-27 格式:PPT 页数:42 大小:586.51KB
返回 下载 相关 举报
OrientX3.0及其改进之处_第1页
第1页 / 共42页
OrientX3.0及其改进之处_第2页
第2页 / 共42页
OrientX3.0及其改进之处_第3页
第3页 / 共42页
OrientX3.0及其改进之处_第4页
第4页 / 共42页
OrientX3.0及其改进之处_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《OrientX3.0及其改进之处》由会员分享,可在线阅读,更多相关《OrientX3.0及其改进之处(42页珍藏版)》请在金锄头文库上搜索。

1、OrientX3.0及其改进之处XML小组大纲OrientX3.0的体系结构OrientX3.0的主要特征OrientX3.0的查询处理问题【系统的效率】基于代数引擎的XQuery/Update实现问题OrientX3.0需要改进地方的总结体系结构OrientX3.0的体系结构图大纲OrientX3.0的体系结构OrientX3.0的主要特征OrientX3.0的查询处理问题【系统的效率】基于代数引擎的XQuery/Update实现问题OrientX3.0需要改进地方的总结OrientX V3.0的新特征New architectureSupport W3C XQuery/UpdateA se

2、t of programming APIUsable index managementVisual toolsApplication大纲OrientX3.0的体系结构OrientX3.0的主要特征OrientX3.0的查询处理问题【系统的效率】基于代数引擎的XQuery/Update实现问题OrientX3.0需要改进地方的总结查询处理策略 导航查询处理 (OrientX2.0)代数查询处理 (OrientX2.5, OrientX3.0)基于导航的查询处理例子找到价格最低的书Element ConstructorPath ExpressionFLWR ExpressionConditiona

3、l ExpressionBuilt-in-FunctionAttribute Constructor1.Step2.CondTreeNode3.Path4.ForVarBind5.LetVarBind6.FLWR7. EleConstructor8. AttrConstructor9. BuiltInFun10. IfThenElse11. Quanlify12. SetOpt13. SortBy目前有目前有13中操作符中操作符: 导航处理的操作符处理处理XQuery的流程的流程Parser and TranslatoroptimizerEvaluator EngineXQuery Query

4、Initial Query planoptimized Query plan查询计划示例查询计划示例bibbooktitlepublisherpriceyeartitlebookbookpublisherpriceyear。查询计划查询计划$doc查询计划的执行示例查询计划的执行示例文档文档bibbooktitlepublisherpriceyeartitlebookbookpublisherpriceyear。$doc$t查询计划的执行示例查询计划的执行示例文档文档查询计划查询计划bibbooktitlepublisherpriceyeartitlebookbookpublisherpric

5、eyear。$doc$t$p查询计划的执行示例查询计划的执行示例文档文档查询计划查询计划bibbooktitlepublisherpriceyeartitlebookbookpublisherpriceyear。$doc$t$pprice65.95TCP/IPIllustrated minprice查询计划的执行示例查询计划的执行示例文档文档查询计划查询计划bibbooktitlepublisherpriceyeartitlebookbookpublisherpriceyear。$doc$t$prepeatprice65.95TCP/IPIllustrated minprice查询计划的执行示

6、例查询计划的执行示例文档文档查询计划查询计划bibbooktitlepublisherpriceyeartitlebookbookpublisherpriceyear。$docpriceminpricepriceminprice results65.9570.05查询计划的执行示例查询计划的执行示例文档文档查询计划查询计划导航查询引擎小结优点优点简单,直接,而且对简单查询非常有效简单,直接,而且对简单查询非常有效符合符合XQuery的特点:的特点:过程化查询语言过程化查询语言任意的嵌套任意的嵌套缺点缺点对复杂的查询需要遍历文档多遍对复杂的查询需要遍历文档多遍访问了非常多的无用结点访问了非常多的

7、无用结点不利于查询优化不利于查询优化代数查询引擎-OrientXA一次一集合的查询处理策略XQuery处理的问题数据抽取操作选择投影结果构造操作结构构造数据处理操作连接消除重复分组Q1:一个XQuery例子 for $b in doc(bib.xml)/bib/book let $a := $b/author where $b/publisher/text() = Addison-Wesley and $b/year 1991 return $b/author 导航处理construct a for $bib in doc (“bib.xml”)/bib dofor $b in $bib/bo

8、ok do let $a := $b/author for $publisher in $b/publisher do if $publisher/text() = Addison-Wesley then for $year in $b/year do if $year 1991 then construct a under construct a attribute year for with value $year append $authors content under end-if end-for /$year end-if end-for /$publisherend-for /$

9、bend-for /$bib for $b in doc(bib.xml)/bib/book let $a := $b/author where $b/publisher/text() = Addison-Wesley and $b/year 1991 return $b/author OrientXA关于Pattern Tree观察:XQuery一个变量绑定对应一个XPathPattern Tree标识和抽取查询感兴趣的结点()Pattern Tree实际上是XPath的树状表示()类比关系(?):Pattern Tree vs. 表定义Instance Tree vs. 元组Instanc

10、e Tree集合 vs. 表Q1对应的Pattern Tree和Algebra Tree for $b in doc(bib.xml)/bib/book let $a := $b/author where $b/publisher/text() = Addison-Wesley and $b/year 1991 return $b/author 强结点绑定弱结点绑定序列绑定或序列构造 父子边祖先后代边元素属性边图例:p: 绑定所有后代结点n: 新建结点c: 拷贝结点SPTCPT Source pattern tree 数据抽取的结果 Construct pattern tree 结点绑定 拷贝

11、绑定 Predicates 灵活的代数处理问题1数据抽取效率数据抽取的方法1有:Navigation:对文档树进行遍历,找到满足pattern tree 的实例树;效率低下。Structure Join:利用对XML 数据的编码和Tag Index,快速地找到满足祖先后代关系的结点。Holistic Twig Join:整体求解1 孟小峰,罗道锋,蒋瑜,王宇,OreintXA:一种有效的XQuery查询代数,软件学报,卷15(11),1648-1660,2004,11 OrientX采用策略采用策略问题1 V3.0测试报告查询效率低查询效率低问题1分析数据抽取:数据抽取:访问磁盘的操作访问磁盘

12、的操作结果构造:结果构造:内存中的中间结果内存中的中间结果结果构造:结果构造:内存中的中间结果内存中的中间结果 for $b in doc(bib.xml)/bib/book let $a := $b/author where $b/publisher/text() = Addison-Wesley and $b/year 1991 return $b/author 数据抽取的效率很大数据抽取的效率很大程度上决定了代数系程度上决定了代数系统的效率统的效率问题1分析 (2)Navigation处理尚未利用任何索引 for $b in doc(bib.xml)/bib/book let $a :=

13、 $b/author where $b/publisher/text() = Addison-Wesley and $b/year 1991 return $b/author 问题1的解决办法物理实现采用Twig查询处理方法建立索引Tag IndexPath IndexSequence Index利用TwigStack查询处理方法Tag Index问题1的解决办法(2)索引建立在DEB存储的文档导入时创建索引代码修改集中在DEB方式的四个SAX接口中startDocument, endDocumentstartElement, endElement查询处理代数操作的流水线操作TwigStack

14、操作的输出为Sequence (满足一次一集合操作)数据抽取操作添加CTwigPatternMatching类大纲OrientX3.0的体系结构OrientX3.0的主要特征OrientX3.0的查询处理问题【系统的效率】基于代数引擎的XQuery/Update实现问题OrientX3.0需要改进地方的总结XQuery/UpdateXQuery1.1包括XQuery/UpdateXPath 2.0 Full-Text SearchXQuery 1.0XQuery/Update (2)Insert, Delete, Replace, Rename, Transform表达式1.Insert 语句

15、 2.Delete语句Insert 50 after /book/author Delete /bookyear = 1994/author XQuery/Update (3)3.Rename(修改结点名字), Replace(替换结点或值)4.Transform查询copy $a := /bookmodify delete $a/authorreturn $a 执行前执行后查询结果Transform查询的应用1.修改查询结果修改查询结果 查询: book的信息,但不返回 price信息2.安全视图安全视图3.更新虚拟视图更新虚拟视图copy $a := /book modify delete

16、 $a/price return $a 访问控制访问控制: 用户A不能访问author 为”Rose” 的book结点的price用户A提交查询: /book合成Transform查询: copy $a := /book modify delete $aauthor = “Rose”/price return $aXQuery代数处理类似关系代数一样,提出了一系列的操作符.FOR $b in /book/priceFOR $y in /book/yearWHERE $b/price 1990RETURN $bSelectFilter $2 1990 Construct $2XQuery/Upd

17、ate代数处理copy $cb := /bookmodify delete $cb/pricereturn let $nb := $cb where $nb/title = “C+” return $nbConstruct $nbFilter $nb/title = “C+” 现有的XML代数能否表达XQuery/Update?扩展扩展现有XML代数(基于OrientXA):提出新操作符:1. Copy (拷贝)2. Insert (插入)3. Delete (删除)4. Replace (替换)5. Rename (重命名)Select book $1Copy $1Delete($2)Fil

18、ter $nb/title = “C+” Construct $nb问题2如何实现Transform查询?查询编译Lex、Yacc查询处理修改XML代数规则添加Transform操作符问题2分析Transform查询语句分析CopyModifyInsertReplaceDeleteFLWR语句copy $cb := /bookmodify delete $cb/pricereturn let $nb := $cb where $nb/title = “C+” return $nb问题2分析 (2)代数操作符的添加CopyModify?几个操作符的组合?大纲OrientX3.0的体系结构OrientX3.0的主要特征OrientX3.0的查询处理问题【系统的效率】基于代数引擎的XQuery/Update实现问题OrientX3.0需要改进地方的总结需要改进的地方总结尚未完全支持XQuery/Update查询编译解析Lex/Yacc的修改基于代数的查询处理引擎代数操作符的添加代数引擎中的数据抽取效率低存储在数据导入(DEB方式)时建立索引查询 执行的物理操作采用Twig查询匹配方法查询结构的重构问题 Thanks_ Q & A

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号