将二进制数据嵌入XML文档的三种方法

上传人:ldj****22 文档编号:29984856 上传时间:2018-01-26 格式:DOC 页数:7 大小:71KB
返回 下载 相关 举报
将二进制数据嵌入XML文档的三种方法_第1页
第1页 / 共7页
将二进制数据嵌入XML文档的三种方法_第2页
第2页 / 共7页
将二进制数据嵌入XML文档的三种方法_第3页
第3页 / 共7页
将二进制数据嵌入XML文档的三种方法_第4页
第4页 / 共7页
将二进制数据嵌入XML文档的三种方法_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《将二进制数据嵌入XML文档的三种方法》由会员分享,可在线阅读,更多相关《将二进制数据嵌入XML文档的三种方法(7页珍藏版)》请在金锄头文库上搜索。

1、将二进制数据嵌入 XML 文档的三种方法将二进制数据嵌入 XML 文档的三种方法将 XML 用于 B2B 应用程序之间的数据传输Gowri Shankar(vgowriaquila.co.in)软件工程师,AQUILA Technologies Pvt.LtdXML 用于数据互操作性的主要优点是其可扩展性及其能够以文本格式表示所有形式的数据的能力。甚至当处理二进制数据时,XML 也证明了它的价值。本文集中讨论了在 XML 中表示二进制数据的三种方法。第一种方法以最适当的方式使用 XML 和 DTD 表示二进制文件或数据源。第二种方法使用一种简单格式,其中每个人都能定义自己的格式来表示二进制数据

2、。在第三种方法中,所有二进制数据都包含在 XML 文件中。XML 已经改变了完全不同的应用程序 这些应用程序使用不同的技术、操作平台和位置 之间交换、共享和传输数据的方式。对于所有这些数据的运动,为达到可伸缩性,必须记住的唯一一点是通过启用 HTTP 的标记来包装数据。通过 HTTP 发送数据的最佳途径是使用 XML,有许多原因可以说明它比 HTML 好。最初,HTML 被认为只能处理文本,但是现在它还普遍用于引用和标记非文本数据。所以 XML 步 HTML 后尘是十分自然的。因为 XML 不必遵循特定的语法(象 HTML 那样)并且比 HTML 更具可扩展性,所以人们可以以他们想要标记各类数

3、据的任意方式来使用它。尽管如此,HTTP 通常仍作为传输层使用;因此 XML 在处理二进制数据时必定受到许多约束。当二进制数据是用户或客户机应用程序请求的全部信息的一部分时,XML 只用于标记该二进制数据。而且,在 XML 中包含二进制数据的优点是便于在 HTTP 上传送数据。演示应用程序:GODOWN 和 AGENT在应用程序之间有时候会传输非文本数据。例如,设想有两个 B2B 应用程序:GODOWN 和 AGENT。GODOWN 维护公共库中的所有存货;AGENT 是销售界面。当用户在 AGENT 上选中一个产品名时,就向 GODOWN 提出有关该产品详细信息的请求。以下是操作技巧部分。例

4、如,如果该产品是一块手表,那么应用程序可能显示诸如价格、制造商地址和手表图片等详细信息。如果该产品是一盒迈克杰克逊 CD,那么详细信息可能包括用户可以播放的样品媒体文件。本文将关注于通过 XML 进行数据(二进制数据)定义和描述,以及如何访问这个二进制数据。正如您会发现的那样,在开发时不能决定数据的本质,并且可能需要经 HTTP 传送该数据来提供通用访问。XML 是描述和定义数据的一种非常便利的框架,所以我们使用它来定义库存中的产品 库存由 GODOWN 应用程序来维护。让我们看一下这两个应用程序之间进行数据传输过程中的不同阶段。以下是一个数据请求进程的生命周期:从 AGENT 向 GODOW

5、N 发出带 ProductId 的 HTTP 请求。GODOWN 获取标识并为所需的产品编制 XML 文档。然后用 AGENT 应用程序理解的方式格式化这个 XML 文档,并以字节流的形式将它发送回 AGENT。有两种方法可以完成这个操作:从 GODOWN 将 XML 文档传送到 AGENT,这样生成的文件格式为 agentproduct1.xml(请参阅下面显示的代码)。解密 XML 数据并将二进制数据编码为字符串格式,然后将之转储到 CDATA 节中并发送到 AGENT。这使 AGENT 的作业稍微简单些。生成的文件格式将是 agentproduct2.xml(请参阅下面显示的代码)。AG

6、ENT 接收来自 GODOWN 的字节流并对其进行相应处理。三种方法现在,我们需要将一个应用程序的二进制数据传送到另一个应用程序中。让我们看一下用 XML 文件表示二进制数据或将二进制数据嵌入到 XML 文件中的三种方法,这里简要地列出了这三种方法,下面还有更详细信息:第一种:通过外部实体和标记法的方式来表示二进制数据第二种:使用 MIME 数据类型来表示二进制数据第三种:将二进制数据嵌入 CDATA 节中虽然这三种方法都可以用来表示二进制数据,但不是每种方法都可以适用于任意给定的情况中,而且一种方法未必能很好地替代另一种方法。换句话说,可以同时应用这些方法使之相互协作相互补充。为了详细阐述这

7、一点,让我们考虑示例应用程序。如果您必须维护库中所有产品的详细信息,(以便能对任何产品的请求提供服务),那么最佳方法是使用方法 1 以单一大型 XML 文件的形式来表示数据。甚至方法 2 也适用于这一目的,但是在数据的可扩展性上有某些限制(实体重用等)。当必须传送数据时,如果数据大小相对比较小,那么我们应该应用方法 3。另一种选择是首先高速缓存实体名称和 systemid,然后将详细信息发送到另一个应用程序或方法来处理(下载显示)数据。在确定哪种方法最适合给定的情况时,尽管没有指导原则或标准,您还是可以识别哪种方法最适合于您的情况。现在应该更详尽地查看这些方法了。第一种方法 通过外部实体和标记

8、法的方式来表示二进制数据 用来描述数据。正如我们已经看到的,在使用 Request 和 Response 范例的数据访问中本质上有三个阶段。它们是:描述数据并将之存储在一个公共区域以供访问。将请求的数据提供给客户机(响应)。在客户机应用程序中表示已提供的数据(经过一些修改变换)。这里,以标记法(称为外部实体)的形式描述二进制数据,通过使用 DTD 来保持数据的持久性。我们应使用第一种方法来进行二进制数据的描述和存储。甚至第二种方法也适用于相同的目的 这两种方法的区别在于是否使用 DTD 的应用程序。如果不能确定是否需要 DTD,那么有一个简化的和范围缩小的选项:当产生请求这样一个二进制数据时,

9、可以通过使用 HTTP 将它发送到客户机;然后,客户机应用程序完成一些转换并向用户表示。如果客户机是启用 HTTP 的,象一些浏览器,那么可以将这个 XML 数据转换为 HTML 并显示。但是如果最终用户环境不启用 HTTP,那么我们必须分别下载所有引用的二进制数据源。在这样的情况中,我们必须使用方法 3。当出现请求二进制数据时,读取二进制数据源并打包到 XML 文档中作为以 base64 编码的字符。将之发送到客户机。这个阶段的缺点是数据传送需要更多等待时间,读取和编码需要更多处理时间。当客户机应用程序读取这个 XML 文件时,它对 base64 字符进行解码,将二进制数据写入本地文件系统的

10、一个文件中,并使用那个引用来向最终用户表示这一数据。方法 3 非常适合于二进制数据源不是一张图片或能显示的东西的特定情况;它可以是一个数字签名或一个可执行文件。通过外部实体和标记法的方式来表示二进制数据这是在 XML 文档中表示二进制数据最好的方法。虽然许多人会争论 DTD 使它变得混乱,但是我仍将建议这是非常有效的方法,因为数据在 XML 文档中模块化,并且从 DTD 中抽取二进制数据(源、文件名等)的详细信息。要以这种方法完成操作,您需要了解 XML 和 DTD。查看下面的样本 XML 和清单 2 中的 DTD。清单 1. 样本 XML 产品文件:product.xml watchHMT

11、ShakthiSG CS 07 ARs.5002 daysXML 文件应遵循 DTD 并且通常包含许多产品标记,每个标记包含一个产品和它的详细信息。当 AGENT 应用程序向 GODOWN 应用程序发送一个或多个标识时,GODOWN 应用程序对 XML 文件进行语法分析并获取与产品相关的所有详细信息,然后将它们发送回服务器。在向服务器发送详细信息前,它应按照 AGENT 要求的格式重新编制数据。清单 3 中显示了一个这样的输出格式。转换成这个格式的 Java 程序是 agent1.java,在 binaryxml.zip(请参阅参考资料)中提供了该程序。这个格式不涉及处理二进制数据;它只描述和

12、提供二进制数据。AGENT 应用程序通过使用 URL 能直接引用二进制数据,或者它能从 URL 下载文件来保留本地副本。如果它必须在浏览器中显示信息,那么它能直接引用信息,因为它有链接。在这种方法中,我们获得格式良好的 XML。查看文件 agent1.java(请参阅参考资料)来了解它如何对 XML 文件和 DTD 进行语法分析,以便搜集有关外部实体引用的信息。使用 MIME 数据类型来表示二进制数据这种方法使用 MIME 数据类型来描述二进制数据数据源时有两种方法:使用可扩展邮件传送协议(XMTP)或者类似的 MIME 编码服务器应用程序将不同的 MIME 类型映射成 XML 文件中的二进制

13、数据类型让我们看一下这两种方法的优缺点。在第一种方法中 使用 XMTP,将软件的可使用性限制于启用 XMTP 的应用程序,或者在不使用启用 XMTP 的软件时,必须用另一个 XML 解码器来打包这个层。这意味着我们还必须实现第二种方法,而且我们还要有可用于同一目的的一些 XMTP API 因此这没有使我们有更好的适应性。另外,我们所关注的是用 XML 而不是用 XMTP 来表示二进制数据,所以我们将集中讨论第二种方法 映射不同的 MIME 类型及其资源。对 MIME 和 XMTP 更感兴趣的人,请参阅参考资料,从 openhealth.org 获得实现信息。映射 MIME 类型和二进制数据当我

14、们必须映射 MIME 类型和二进制数据时,我们又有两个选择。第一个是用 DTD 中的二进制资源来系统地表示 MIME 类型。由于在本文的前面部分我们已经看到了类似表示,所以让我们来看一些不同的表示。DTD 只用于定义文档格式,并且将在 XML 文件本身中定义 MIME 类型。虽然总可以使用 DTD 来验证,但是这种方法的最佳用途是减少对 DTD 的依赖并使之成为自我描述的 XML 格式。由于它是自我描述的,所以它是可进化的方法。通过使用 XML 文件中的 MIME 类型,让我们来查看用于定义 product.xml 的变体版本的方法。清单 4. product.xml 版本 2:product

15、-mime.xml HMT ShakthiSG CS 07 ARs.5002 dayssgcs07a3.jpg 除了显示标记不同外,这个 XML 文件遵循与原始 product.xml 文件相同的结构。它描述了二进制数据文件的元数据。所以,当 AGENT 应用程序发送标识时,mimeagent.java(在 binaryxml.zip 中)对标识的 product-mime.xml 进行语法分析并将输出的 XML 文件生成为 agentproduct2.xml(请参阅下面的代码)。agentproduct1.xml 和 agentproduct2.xml 之间的唯一区别是后者在 CDATA 节

16、中包含文件内容,而不是文件名称。我们正在将二进制内容嵌入 XML 文件本身而不是在 XML 文件中描述它的来源。下面显示了 agentproduct2.xml 的一个样本格式。清单 5. 输出格式 2:agentproduct2.xml watchHMT ShakthiSG CS 07 ARs.5002 days在用方法 1 和方法 2 解释 XML 数据的客户机应用程序之间有一个显著的区别。在方法 1 中,客户机应用程序只须转换可用的 XML 数据并以 HTML 或一些其它格式显示。通过使用 XSL、CSS 等可以很好地实现。然而,在方法 2 中,客户机应用程序必须解释 CDATA 节并将打包的二进制数据解码为原始格式,然后必须将它存储到本地文件系统中。存储在本地的二进制数据源用于进一步引用。表示之前需要一个处理阶段。使用这个方法之前必须注意这一点。我们已经揭示了将二进制数据流发送回 AGENT 应用程序的第二个方法。第三种将使 AGENT 应用程序能够处理 XML 数据并生成用户可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号