1、1基于基于 XMLXML 的的 WebWeb 查询技术研究查询技术研究摘摘 要要WWW 是目前使用最为广泛的 Internet 信息服务系统,它为用户提供了一个搜索和浏览信的工具。但 WWW 是一个信息的海洋,数亿万计的 Web 文档散布在世界各地的成千上万个 Web 服务器上,并且每个服务器自主管理自己的资源,没有一个统一的管理机制。总体状况是,整个网络上资源丰富,内容庞杂,很难实现数据的共享,亦不能进行有效地查询。XML 的出现为解决上述问题提供了理想的解决方案。XML 全称为Extensible Markup Language,即扩展标记语言,是SGML(Standard General

2、ized Markup Language)的一个简化的而又严格的子集,它是特别为 Web 应用设计的,XML 是一个在互联网上进行数据交换的理想工具。由于 XML 能够使不同来源的结构化的数据很容易地结起,从而使搜索多样的不兼容的数据成为可能,为解决 Web 查询问题带来了希围绕着基于 XML 的 Web 查询技术涉及到的几个主要问题展开研究与讨论:1.针对 Web 上的数据格式差异大、数据来源差别大及当前的数据模型不能很好地描述 Web 上数据的缺点,研究和探讨了 Web 上的数据模型-XML 数据模型。2.解决异构数据的集成问题。由于异构数据的集成主要是异构关系2数据库中数据的集成。所以本

3、文采用了基于“中间模式”的方法进行数据的集成,将关系数据库中的数据转换为通用的 XML 格式的数据,从而更好地实现数据的共享。3. 利用 XML 数据模型在半结构化数据表示和查询方面的优势,通过基于 XML 查询语言 XML-QL 实施 Web 查询。在 XML 出现以前,面向 Web 数据查询是一项复杂的技术。通过本文的研究方法,如果通过 XML 数据模型描述 Web 上的数据,把不同来源的结构化的数据转换成 XML 格式的数据,就能够方便的实现数据的共享和进行精确、有效的信息查询,将极大的简化复杂性,提高工作效率。关键词:关键词:XMLXML;WebWeb 查询查询;半结构化数据半结构化数

4、据;数据模型数据模型3Based on XML Web inquiry engineering researchxxx(Undergraduate Classes of Information management and information system Subject of 2003 Grade , College of LongQiao,LanZhou Commercial College)ABSTRACTWWW is the most widely used information scivice system on the Internet。It offers a tool to

5、 search and hi uwse information. But WWW contains too much Information.and billions of pages located on thousands of servers in different palaces in the world. Every server manages its own resources, and does not follow one standard managing mechanics. In general, there are wealthy of various resour

6、ces on the net, which can not be shared anc queried effectively.The emergence of XML provides a resolution to the above-mentioned problem The full name of XML is Extensible Markup Language.It is a simplified and restricted stbset of SGML, particularly devised for Web application. XML is an excellent

7、 tool for data exchange on the internet. Due to its capability to combine structured data with different sources, XML makes it Fossible to retrieve data from different and 4incompatible database servers, and brings hopes for Web data query. This article focus on these following problems: 1. Consicer

8、ing the big difference of data format and data sources on the Web, We made research and discuss on the Web data model -XML data model. 2. To resolve the problem of integration of data with. different structure. Because the integration problem mainly focus on the integration of different structured R

9、DBMS, this article adopted mediated schema and transformed the data in RDBMS into XML data source. Therefore, better sharing of data can be ealized. 3.Making full use of the advantages of using XML data model in semi-structured data representation and query,we can carry out dataretrieving queries fr

10、om XML data resources on Web by using XML-QL.Before the emergence of XML,Web-oriented data query is a complex technique. Through the research in this article if we represent Web data by XML data model and transform the structured data from different data source into XML data format sources We will r

11、ealize data sharing and carry out exact and efficient data query,which will simplify ourwork and enhance efficiency greatly.5Key words:XML, Web query, Semi-structured data, Data model目录目录一、引 言(7) 二、基于 XML 的 Web 查询技术研究(8) 1 Web 查询涉及的几个主要问题(8) 2 Web 上的数据模型-XML 数据模型(9) 3 异构数据库的集成(20) 4 基于 XML 的 Web 查询(

12、29) 三、结 论(44) 参考文献(45)6基于基于 XMLXML 的的 WebWeb 查询技术研究查询技术研究一、引一、引 言言随着互联网的普及,网络已成为人们获得信息的主要途径和重要手段网络资源丰富,闷容庞杂,网络上的数据能否很好地得到共享成为影响网络发展的个重要因素但就目前来看,我们日常用到的数据大部分是无结构的文档和完全结构化的关系数据库中的数据,如果把这些数据放在互联网上很难实现数据的共享为此,必须改变当前数据格式的多样性和共享性差的缺点,用一种统一的数据格式来表示数据,从而实现数据在互联网上更大范围内的共享。如果能够把不同来源的结构化的数据比较容易地结合在一起,将使搜索多样的不兼

13、容的数据库成为可能,从而为解决 Web 数据查询难题带来了希望。XML 的出现为解决上述问题提供了理想的解决方案。它是特别为 Web 应用设计的,它是针对于 HTML 和 Internet 的标准的、可扩展的、通用的数据格式。XML 保留了 SGML 可扩展性、结构性以及数据确认方面的主要优点,它的灵活性允许表示各种各样的信息,而这些信息是自我描述的,所以 XML 表示的结构化的数据可以被那些没有关于这些数据的知识的软件来处理,实现数据在互联网上更大范围内的共享。XML 是一种半结构化的数据模型,XML 的文档描述的语义非常清楚,它的可供操作的基础要比 HTML 好得多,而且很容易就可以将之和关系数据库中的属性一一对应起来,能够支持实施十7分精确有效的查询。本文围绕着基于 XML 的 Web 查询技术涉及到的几个主要问题展开研究与讨论:1.针对 Web 上数据的自身特点,研究与探讨了适于表示 Web 上数据的数据模型 XML 数据模型;2.为了更好地实现 Web 数据的共享,本文给出了从关系数据库中结构化的数据向 XML 格式数据的转换方法,解决异构数据的集成问题;3. 利用基于 XML 的查询语言 XMLQL 实施 Web 上 XML 数据源的查询。二、基于二、基于 XMLXML 的的 WebWeb 查询技术研究查询技术



