XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章

上传人:E**** 文档编号:89355125 上传时间:2019-05-23 格式:PPT 页数:51 大小:700KB
返回 下载 相关 举报
XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章_第1页
第1页 / 共51页
XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章_第2页
第2页 / 共51页
XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章_第3页
第3页 / 共51页
XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章_第4页
第4页 / 共51页
XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章》由会员分享,可在线阅读,更多相关《XML案例教程高职 教学课件 ppt 作者 眭碧霞 全书 第1章(51页珍藏版)》请在金锄头文库上搜索。

1、第1章 XML语言简介,1.1 置标语言概述 1.2 XML语言及其应用 1.3 XML文档的编辑工具 1.4 一个简单的XML文档实例 1.5 本章小结 习题1,1.1 置标语言概述 传统意义上的标记(markup)我们经常会遇到。例如,老师批改过的试卷,经常是满篇红色醒目的对号、错号、问号、波浪线或者意味深长的评语,这些都是标记;我们在看书的时候,也喜欢用荧光笔将重要的内容加亮,以帮助我们在日后重读文章时,能够提纲挈领、迅速抓住要害,这也是标记。从广义上来说,一篇文章中的标点符号、空格等都可以称做标记。这些标记使我们接触的文档具备了不同的意义,并协助我们完成不同的目标。,所谓置标语言(ma

2、rkup language),则特指用一系列约定好的标记来对电子文档进行标记,来实现对电子文档的语义、结构、格式的定义。这些标记应该与文档内容相区分且易于识别。标记语言必须定义什么样的标记是被允许的,什么样的标记是必需的,标记是如何与文档的内容相区分的,以及标记的含义是什么。,1.1.1 SGML语言起源 为了促进数据的交换和操作,人们很早就产生了将文件结构化为标准格式的动机。20世纪60年代,IBM公司创建了GML(Generalized Markup Language,通用置标语言),以在其出版系统内部实现这一需求。 SGML(Standard Generalized Markup Lan

3、guage,标准通用置标语言)从IBM的GML演化而来,是第一个标准化的信息结构化技术。SGML成为了IBM内部格式化和维护合法文件的手段。,SGML后来被扩展和修改,作为一种全面的信息标准以适应工业范围的广泛应用。但直到1986年,SGML才成为了ISO标准。尽管SGML的功能非常强大,但是由于它非常复杂,需要许多昂贵的软件配合运行,因而在很长一段时间都没有被推广。,1.1.2 HTML语言及其局限性 1989年,欧洲粒子物理实验室(CERT)的研究员Tim Berners-Lee和Anders Berglund创建了一种基于标记的语言,为在Internet上共享的文章做标记,这就是HTML

4、。HTML可以看做是SGML的简化应用,它的诞生,推动了信息产业的大发展。,HTML(Hyper Text Markup Language,超文本标记语言)是一种用来制作超文本文档的简单标记语言。用HTML编写的超文本文档称为HTML文档,它能独立于各作操作系统平台(如UNIX、Windows等)。自1990年以来,HTML就一直被用作World Wide Web(WWW)上的信息表示语言,用于描述Homepage的格式设计和它与WWW上其他Homepage (Hyperlink)的链接信息。HTML语言是通过利用各种标记(tags)来标识文档的结构及超链接信息的。,HTML之所以能够流行,是

5、因为它有简洁的语法。但也正是由于它过于简洁,也产生了以下几个主要问题: (1) 标记扩展复杂。 HTML当初仅仅提供了一种对静态文本信息表现的方法,但显然并不能适应越来越多的需要。随后越来越多的标签产生了,例如用于描述图片,通过为网页加入脚本支持来提供动态网页内容。日益增多的标记不但使HTML越来越庞大,浏览器的开发越来越复杂,还降低了不同浏览器之间的兼容性。,(2) 缺乏严格的语法定义。 HTML文档的正确性很难得到确认。为了使文档的显示过程更加强健,浏览器通常忽略语法分析,不检查语法的正确性。 (3) 结构化支持差。 HTML缺乏对复杂结构的支持,例如HTML不能支持分层嵌套信息结构。HT

6、ML文档间的联系完全是平面的,这限制了全文检索技术的应用,也使得浏览的过程显得笨拙而繁琐。,(4) 数据、格式、超文本及图形用户界面语义混合。 内容提取困难。搜索引擎机械地逐一检索每个页面中所有可以匹配的内容,所以我们往往会得到太多的、难以判断的数据采样。这是由于HTML混淆了数据内容和数据表达,数据内容和数据表达信息都被显式地写在同一文档中的缘故。当我们希望看到用不同表现形式表达的同一内容时(比如需要一个用大号字体排印的版本),就不得不从服务器直接产生。同样,在网页显示上的任何其他变化也都必须由开发者亲自实现。, 难以实现数据交换。HTML难以实现自动的数据交换,它的标签只用来控制文档的显示

7、,却不能标示出数据域。 信息重用性差。HTML不易重复使用已有的信息。如果要重新在网上发布同样的信息,或者希望为已有的信息编辑可打印的目录,或需要把网上的数据存入数据库,往往不得不用手工进行处理,更糟糕的是,当网上的数据发生变化时,这些过程都必须重做。 HTML存在的这些问题随着互联网的蓬勃发展不但没有得到解决,反而越来越突出,成为HTML继续发展应用的障碍。,1.1.3 XML语言的诞生及其优点 1996年,W3C(万维网联盟)寻找一种在Web中应用SGML的灵活性和强大功能的方法,这导致了1998年2月XML 1.0规范的发布。XML(eXtensible Markup Language,

8、可扩展置标语言)不但具备了SGML的核心特性,而且非常简洁,XML规范的内容甚至不到SGML的1/10。XML作为SGML的子集,同样继承了SGML的优点扩展性、结构化和有效性。,与HTML相比,XML具有以下几个优点: (1) 可扩展性强。 定义一个标记语言并进行推广和应用,这在XML语言出现之前是非常困难的。一方面,新的标记语言标准化时间很长,从标准提交到相关标准化的建立,要经过几轮的评定和修改,等到正式发布标准时,可能已经过了几年的时间。另一方面,为了推广标准的广泛应用,制定者必须开发相应的标记解释和浏览工具,新的标记语言需要各个厂商进行支持和开发,同样要耗费大量的时间和精力。,各个行业

9、对标记语言的不同需求,决定了定义一套各行业都能够普遍应用的标记是不可能也没有必要的。例如,数学需要大量的函数标记,化学需要大量的化学公式标记,建筑学则需要大量的设计图纸标记。XML语言允许各个不同的行业根据自己的需要制定适合自己行业的标记,同时,XML不要求所有的浏览器都能处理这成千上万个标记,也不会要求标记语言的设计者制定出一个非常详尽、全面的语言。这种思想大大加强了XML语言的可扩展性和灵活性。,(2) 遵循严格的语法要求。 HTML语法要求并不严格,浏览器可以显示有语法错误的HTML文件。例如,“加粗显示”和“加粗显示”这两条语句在浏览器中的显示效果是一样的,但前者明显没有进行标记的配对

10、。 XML非常注重准确性,在语法结构上只要有丝毫错误,分析器都会停止对XML进行进一步的处理。XML不但要求标记配对、嵌套,而且还要求严格遵守DTD(文档类型定义)的约定。,XML分析器处理XML文档的过程中不会进行任何猜测和修改,要么文档被判定为正确而执行或显示,要么文档被判定为错误而停止处理。而HTML的标记已成为标准,HTML分析器可以判断出HTML中到底有什么,又缺什么。 XML分析器的这种严格性大大减轻了浏览器开发人员的负担,也提高了浏览器的效率;同时,严格的语法要求又为XML文档提供了较好的可读性和可维护性。,(3) 数据内容与数据表达分离。 下面给出一个XML示例文档来了解一下X

11、ML是如何表达数据的。 【例1-1】 案例说明:XML数据文档。 程序名称:ch1-1.xml ,软件工程 ISBN=“7-5606-0924-4/TP0851” 介绍软件工程理论. 邓良松 计算机 西安电子科技大学出版社 2001年6月 20.00 ,案例分析:该XML数据文档描述了一本计算机图书的相关信息,数据简单明了。XML是自我描述语言,携带的信息不只是信息内容的描述,还包括语义的描述。因此,即便是对于一个对预定义标记一无所知的人,这个XML数据文档也是可读的,例如文档中的“软件工程”便表达了“软件工程”代表的是“书名()”。,数据内容和数据表示的分离使数据搜索可以简单高效地进行,搜索

12、引擎没有必要再去遍历整个文档,而只需要找一下相关标记的内容。以上例文档为例,查找价格小于45元的书籍,只要查看这个标记下的数据是否匹配即可。 XML中,显示的样式和数据的内容放在不同的文档中。如果要改动信息的表现方式,无需改动信息本身,只要改动与数据文档相关的样式文档就可以了。XML中数据的交换和重用也更加便捷。,1.2 XML语言及其应用 1.2.1 XML语言的概念 XML不但是置标语言,而且是可扩展(extensible)的置标语言。HTML提供了一组事先定义好的标记库,XML则提供了一组标准。根据这个标准,可以根据实际需要自定义新的标记语言,并设计相应的一套标记,就像我们在数据库设计时

13、为了表达信息而设计一组字段一样。因此,准确地说,XML是一种元置标语言,它允许程序开发人员根据它所提供的规则制定各种各样适合实际问题需要的标记语言,这也正是XML制定之初的目标所在。,XML规范展示了如下的设计目标: (1) 在Internet上直接使用XML。用户能够像使用HTML文档那样快速而简单地打开和浏览XML文档。在实际应用中,只有当XML浏览器像HTML浏览器那样被大量广泛地使用时,才能达到这个目标。 (2) XML应该支持非常广泛的应用,它能够在著作、浏览、内容分析等领域发挥巨大的作用。如此看来,当初仅因为需要在Web上传送结构化文档而定义XML的想法倒显得十分狭隘了。,(3)

14、由于XML可以兼容SGML,因此很多人用它来处理那些十分庞大、繁琐而原本需要SGML来处理的信息。XML设计得很实用,能够兼容已经存在的标准,并且能够解决在Web中传输结构化文档的新问题。 (4) 计算机程序能够很好地处理XML文档。说得比较通俗一点,开发一个处理XML文档的程序相当容易。 (5) 在XML中,随意数值保持足够地小,理想上是0。随意特征不可避免地带来兼容性的问题,以至于用户在共享文档时会出现失败的情况。,(6) XML文档应该保持可读性和一定的清晰程度。如果没有XML浏览器,或者接收到一个篇幅巨大的XML文档,也能够通过常用的文字编辑软件来阅读XML文档,并且了解其内容。 (7

15、) XML的设计应该是结构合理而简洁的。可以用很多种办法实现上面第(4)条所提到的目标,归根结底来说,XML应符合EBNF(Extended Backus-Naur Form)的表述规范,并遵从现代编译工具和方法来实现。从很多点上可以说明SGML的语法是不符合EBNF的表述规范的,写一个合适的SGML解析器需要处理繁杂的工作,而且难以解析语言的特性,XML不应该如此。,(8) XML文档应该是易于创建的,尽管最终需要使用专用的编辑器来创建和修改XML内容,但是那并不是很紧迫的。在中间过渡期,我们可以选择一些其他的方法来创建XML文档,例如直接用字处理软件生成,或者使用简单的Shell和Perl

16、脚本来生成,等等。 (9) XML标记的简练是其最大的价值所在。XML并不支持SGML中一些功能强大的特性,而这些特性也使得SGML解析器增加了许多额外的负担。,前文我们已经提到XML的优点之一在于数据内容与数据表达的分离,事实上,用XML定义的标记语言可以根据标记描述的侧重点不同而分为两大类。一类偏重于语义描述,如例1-1所示。还有一类偏重于显示方式的描述,如现在已经推出的扩展文本标记语言(eXtensible Hyper Text Markup Language,XHTML)、可缩放矢量图形语言(Scalable Vector Graphic,SVG)以及本书第6章讲到的可扩展样式语言(eXtensible Style Language,XSL)等。特别要注意的是,这里对于显示方式的描述不仅限于对文本的描述,还可以包括矢量图形、图像和声音。比如的标记在描述文本显示时可能是要求字号变大,而在描述声音时则是要求将音量加大。,数据库

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号