基于xml的半结构化数据存储技术研究

上传人:小** 文档编号:89507153 上传时间:2019-05-26 格式:DOCX 页数:59 大小:153.05KB
返回 下载 相关 举报
基于xml的半结构化数据存储技术研究_第1页
第1页 / 共59页
基于xml的半结构化数据存储技术研究_第2页
第2页 / 共59页
基于xml的半结构化数据存储技术研究_第3页
第3页 / 共59页
基于xml的半结构化数据存储技术研究_第4页
第4页 / 共59页
基于xml的半结构化数据存储技术研究_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《基于xml的半结构化数据存储技术研究》由会员分享,可在线阅读,更多相关《基于xml的半结构化数据存储技术研究(59页珍藏版)》请在金锄头文库上搜索。

1、分类号:TP311密级:公开U D C :单位代码:10424学位论文基于 XML 的半结构化数据存储技术研究王燕丽申请学位级别:硕士学位专业名称:计算机应用技术指导教师姓名:孙忠林职称:教授山东科技大学二零零八年五月论文题目:基于 XML的半结构化数据存储技术研究作者姓名:王燕丽入学时间:2005 年 9 月专业名称:计算机应用技术研究方向:网络工程与管理信息系统指导教师:孙忠林职称:教授论文提交日期:2008 年 5 月论文答辩日期:2008 年 6 月授予学位日期:RESEARCH OF SEMI-STRUCTURED DATA STORAGETECHNOLOGY ON XMLA Dis

2、sertation submitted in fulfillment of the requirements of the degree ofMASTER OF PHILOSOPHYfromShandong University of Science and TechnologybyWang YanliSupervisor: Professor Sun ZhonglinCollege of Information Science & EngineeringMay 2008声明本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的研究成果。该论文资

3、料尚没有呈交于其它任何学术机关作鉴定。硕士生签名:日期:AFFIRMATIONI declare that this dissertation, submitted in fulfillment of the requirementsfor the award of Master of Philosophy in Shandong University of Science andTechnology, is wholly my own work unless referenced of acknowledge. Thedocument has not been submitted for q

4、ualification at any other academicinstitute.Signature:Date:山东科技大学硕士学位论文摘要摘要互联网的迅速发展,使得网上数据不断激增。这些数据缺乏统一的、固定的模式,而且往往是不规则、经常变化的。因此,半结构化数据模型应运而生,它是介于完全结构化数据和无结构化数据之间的一种数据类型。要想对这种半结构化数据进行有效的管理是十分困难的。如何对半结构化数据进行有效的管理成为研究的热点。XML技术的出现,推动了半结构化数据的发展。XML数据是一种自描述的半结构化数据,利用 XML文档来管理半结构化数据是一种有效的途径。由于关系数据库在各方面都相对

5、成熟和稳定,因而采用关系数据库对 XML数据进行存储和操作,将半结构化转化为结构化的数据,具有重大的理论意义和实用价值。论文的研究从分析半结构化数据和 XML相关技术出发,旨在设计一种实现半结构化数据到 XML数据的映射算法和一种半结构化数据的存储结构实现 XML数据到关系数据库的映射。论文深入探讨了半结构化数据的定义及特点,分析半结构化数据的模式描述形式以及半结构化数据的模式抽取技术,详细介绍了 XML和数据库的转换技术。目前最具有代表性的半结构化数据的模式描述形式是 OEM模型,它是一种带有嵌套和标记的自描述性有向图。论文采用邻接表表示法实现图的存储,并给出各对象相应的存储结构定义。通过对

6、 OEM模型图的遍历,把 OEM模型所对应的图结构,转换为相应的 XML文档,生成 XML数据,实现半结构化数据向 XML文档的映射。基于有向图的深度优先遍历思想,给出一个转换算法实现了 XML数据的生成。转换得到的 XML数据是一种无模式的数据文档,而且 XML文档中不存在属性的成分,只有元素成分的存在。基于所生成的 XML文档,通过分析 XML文档和数据库技术的相互映射方法,采用一种基于前缀编码的模型映射方法,实现 XML数据和数据库的映射。论文最后给出了一个简单的半结构化电子病历数据,实现了半结构化数据向关系数据库的映射转换,并给出了几个典型的 XML查询实例。真正的通过 XML技术和现

7、有关系数据库技术相联系,实现“以关系数据库为存储手段,以 XML技术为交换载体”的数据管理模式。山东科技大学硕士学位论文关键字:OEM模型图;XML技术;关系数据库;映射;半结构化数据摘要山东科技大学硕士学位论文摘要AbstractWith the rapid development of Internet, the data on the net is increasing continuously. Thesedata lacks unitive and fixed model. Moreover, these data is always irregular and mutativefr

8、equently. So, the model of semi-structured data emerges at the times require. Semi-structureddata is a data type which is between structured data and unstructured data. It is very difficult tomanage the semi-structured data effectively. And how to manage the semi-structured dataeffectively is becomi

9、ng hot spot of research.The appearance of XML technology drives the development of semi-structured data. XMLdata is a self-descriptive semi-structured data, it is an efficient way to use XML document tomanage semi-structured data. As relational database is relatively mature and stable in all areas,u

10、sing relational database to store and operate XML data and changing semi-structured data intostructured data is of great theoretical and practical value.The research of paper sets out from analyzing semi-structured data and XML relatedtechnology, and aims to design an algorithm to realize the mappin

11、g of semi-structured data toXML data and storage structure of semi-structured data to realize the mapping of XML data torelational database.The paper discusses definition and traits of semi-structured data further and analyzes modedescription forms and mode extraction technology of semi-structured d

12、ata, introducesconversion technology of XML and database detailedly.At present, the most representative mode description form of semi-structured data is OEMmodel which is a self-descriptive digraph with nesting and tag. The paper adopts representationof adjacency list to realize the storage of graph, and give the corresponding storage structuredefinition of each object. Through the traversal of OEM model chart, convert thecorresponding chart structure of OEM model to XML document and generate XML data torealize the mapping process of semi-str

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号