《xml知识简介》ppt课件

上传人:tian****1990 文档编号:74812228 上传时间:2019-01-29 格式:PPT 页数:27 大小:247.96KB
返回 下载 相关 举报
《xml知识简介》ppt课件_第1页
第1页 / 共27页
《xml知识简介》ppt课件_第2页
第2页 / 共27页
《xml知识简介》ppt课件_第3页
第3页 / 共27页
《xml知识简介》ppt课件_第4页
第4页 / 共27页
《xml知识简介》ppt课件_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《《xml知识简介》ppt课件》由会员分享,可在线阅读,更多相关《《xml知识简介》ppt课件(27页珍藏版)》请在金锄头文库上搜索。

1、XML知识简介,2006-08-16,XML的定义,XML(eXtensible Markup Language) 可扩展的标记语言 一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。,XML的起源和目标,XML是1996年由W3C (World Wide Web Consortium)赞助,由XML工作组开发的。 目标:1可以直接在因特网上使用 2可以支持更广泛的使用 3与SGML兼容 4便于程序处理XML文档 5尽量减少XML文档的不确定性 6便于人类阅读,条理清晰 7设计便捷 8形式化、简洁 9XML文档易于创建,SGML、HTML、XML,SGML、HTML是XM

2、L的先驱。 SGML“标准通用置标语言”(Standard Generalized Markup Language),是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构,同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,软件价格非常昂贵。 HTML“超文本标识语言” ( HyperText Markup Language)它的优点是比较适合web 页面的开发。但它有一个缺点是标记相对少,只有固定的标记集如、等。缺少SGML 的柔性和适应性。不能支持特定领域的标记语言,如对数学、化学、音乐等领域的表示支持较少。举个例子来说,开发者很难在webpage 上表示数学公

3、式、化学分子式和乐谱。 XML结合了两者的优点、摒弃了其缺点。,SGML、HTML、XML,XML是SGML的一个子集。 由XML语言描述的一系列数据形成XML文档。 XML文档由一系列实体entities构成,可以是字符数据,也可以是格式数据 XML处理器用来接收读取XML文件,XML是什么,XML是元标记语言 用户可以定义自己需要的标记 可以选择XML的元素名称,以便使其在附加的上下文中具有额外的意义 HTML预定义标记语言 XML描述的是结构和语义,而不是格式化 XML标记描述的是文档的结构和意义。它不描述页面元素的格式化。可用样式单为文档增加格式化信息。文档本身只说明文档包括什么标记,

4、而不是说明文档看起来是什么样的。 作为对照,HTML文档包括了格式化、结构和语义的标记 就是一种格式化标记,它使其中的内容变为粗体。,示例, book name author name publisher name isbn number - HTML book name author name publisher name isbn number -XML,XML的特点,设计与特定领域有关的标记语言 允许各种不同的专业开发与自己的特定领域有关的标记语言 自描述数据 使用的是非常简单的数据格式 应用间交换数据 易于阅读和编写、不是专有格式、功能强大 结构化和集成的数据,XML的发展,在专业领域

5、中出现了Web标记语言的许多项目,著名的有CML化学标记语言,由Peter Murray-Rust 开发,同时开发了第一个通用xml 浏览器Jumbo。在数学方面,包括IBM公司在内都在致力开发MathML。 1997年4月,出版了xll的第一个版本。当Xll完整实现时,将比html 和当前浏览器所达到的链接水平更复杂,更强大。 1997年8月,Microsoft公司和Inso公司引入xsl。由于xml是纯结构和语义的,需要描述单个元素格式方法。可以使用html的CSS;另一种方案是xsl. 1998年1月,Microsoft 公司出版发行了msxsl程序。可以利用xsl表和xml文档创建能被

6、IE4 识别的html页面。1998年2月,WC发布了xml1.0的正式版本。 出现了DOM(Document Object Model),XSLT(XSL Transformation)等新名词,xml的应用软件也有了飞速的发展,Microsoft、IBM、Breeze、Stilo等公司纷纷推出了自己的解析器或开发平台。,XML应用简介,编辑器:Notepad、 UltraEdit、XMLSpy XML将文档的内容与文档的外观相分离。首先开发内容,然后再用样式单将格式附加其上。将内容与样式分开是非常有效的技术,这既改善了文档内容也改善了文档外观。对于大型复杂的文档,xml 是一种理想语言,不

7、仅允许指定文档中的词汇,还允许指定元素之间的关系 XML用于不只是一种数据格式的话,就需要与多种相关的技术相互作用。这些技术包括为了向后兼容老式的浏览器的HTML、CSS(Cascading Style Sheet,级联样式单)和XSL(eXtensible Style Languages,可扩展的样式语言)、URL和URI、XLL( eXtensible Linking Language,可扩展的链接语言)和Unicode字符集。,XML小结,一种能够为特定文档和领域创建标记语言的元语言。 XML标记描述了文档内容的结构和语义,而不是内容的格式。格式是在另外的样式单中描述的。 XML的起因是

8、,用户受到SGML复杂性的挫伤和HTML的不充分。 XML是用编辑器创建的,由语法分析程序来读取,而由浏览器来显示的。 在Web上的XML是建立在由HTML、级联样式单和URL提供的基础之上的。 许多支持技术处于XML之上,包括XSL样式单、XLink和XPointer。这些技术使用户可以比只使用CSS和URL完成更多的任务。 XML并未彻底完成。它随时会发生变化或是扩展,而在当前的XML软件中可能会遇到这样或那样的错误。,第一个XML文档, /声明 /开始标记 Hello XML! /元素内容 /结束标记 XML文件的扩展名.xml,第一个XML文档, 处理指令以结束,在 自定义元素名,通常

9、要和元素所代表的意义相关 元素中还可以有属性,XML文档结构,有物理结构和逻辑结构。 从物理结构上讲,文档由一些叫做实体的单位组成,一个实体可以包含另一些实体。文档从一个根(root)开始,或者叫文档实体。 从逻辑结构上讲,文档由声明、元素、注释、字符引用、处理指令构成,所有这些都有清晰的标记显示在文档中。物理结构和逻辑结构都要符合规范要求。,XML文档中的标记,标记有三类意义:结构、语义和样式。结构将文档分成元素树。语义将单个的元素与外部的实际事物联系起来。而样式指定如何显示元素。,XML文档内容,可以包含一个或多个元素,但只能有一个根元素,其他元素都在根元素内部。一个元素的开始标记如果在另

10、一个元素的内部,则它的结束标记也要在这个元素的内部,即不能出现元素的交叉。,XML文档中的元素,元素是XML文件内容的基本单元。从语法上讲,一个元素包含一个起始标记、一个结束标记以及标记之间的数据内容。其形式是: 数据内容 - /空标记 元素可以包含子元素 数据内容 也可以包含属性。属性由联结在一起的属性名和属性值对表示。属性出现在元素开始标记或空元素标记中。 数据内容 ,文档中元素的命名,元素命名区分大小写。 命名可以由字母或一小部分标点符号开头,接下来可以是字母、数字、连字符、下划线、冒号、句号。但XML和冒号在XML文档中有特定的含义,一般不作命名。 &、在XML文档中有特定意义,使用时

11、需要有实体引用。,XML中的实体引用,在XML中,起始和结束标记之间出现的所有合法字符都被忠实地传给XML处理程序。 为了避免把字符数据和标记中需要用到的一些特殊符号相混淆,XML还提供了一些有用的实体引用。 实体引用的作用是,当在字符数据中需要使用这些特殊符号时,我们采用它的 实体引用来代替。这些特殊的XML实体引用包括: ,XML文档中的注释,注释可以出现在文档的任何地方,用来表示 在注释文本中不能出现字符“-“或字符串“-“,XML处理器可能把它们和注释结尾 标志“相混淆。 不要把注释文本放在标记之中。类似地,不要把注释文本放在实体声明中,也不要 放在XML声明之前。XML声明永远作为X

12、ML文件中的第一行。 注释不能被嵌套。在使用一对注释符号表示注释文本时,要保证其中不再包含另一 对注释符号。,形式良好的XML文档满足条件,文档的开始必须是XML声明。 含有数据的元素必须有起始标记和结束标记。 不含数据并且仅使用一个标记的元素必须以/结束。 文档只能包含一个能够包含全部其他元素的元素。 元素只能嵌套不能重叠。 属性值必须加引号。 字符、和“。,三个XML文档示例,员工通讯录 nameaddress.xml 图书馆图书登记 booklist.xml 新闻语料 newscorpus.xml,XML文档验证,数据对象如果符合规范所定义的格式,我们就说它是一个格式良好(well-fo

13、rmed)的XML文档,如果格式良好的XML文档符合某些特定的约束,我们就说它是有效的(valid)。 DTD和SCHEMA DTD (Document Type Definition ) 文件类型定义,XML文档格式化,XML可以定义信息的内容,却没有定义信息该如何表达,这实际上就是XML的长处,它把内容和形式分离了,这样同一个内容可以有不同的表达,增强了文本的重用性 XML内容的表达就是通过XSL(XML Style Language)和CSS(Cascading Style Sheets 层叠样式表)来实现。,其他相关概念,DOM 即Document Object Model, 它把XM

14、L文档的内容实现为一个对象模型,简单的说就是应用程序如何访问XML文档,W3C的DOM Level 1 定义了如何实现属性、方法、事件等。 XSLT即XML Stylesheet Language Transformation。1999年的11月通过了XSLT。XSLT是一种用来进行XML文档间相互转化的语言,利用XSLT我们可以从一个已经定义的XML文档抽取我们需要的数据,组成不同的形式,可以是XML, HTML和各种不同的SCRIPT。,其他相关概念,Xpointer和Xlinks类似于HTML中的Hyper Link ,用于联结其他的XML文档和其他XML文档中的部分,其中Xpointer相当于HTML中用于定位HTML文档子内容的锚,可以定义到文本的局部内容 XML框架,所谓框架即Framework。XML framework是驾驭XML文件的结构,是一种高层次的结构控制。利用XML framework,可以把商业逻辑(business logic)分离出来,实现数据与计算的分离。,The End,中国XML论坛 http:/,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号