本章中将学习到如下内容.ppt

上传人:博****1 文档编号:570194824 上传时间:2024-08-02 格式:PPT 页数:33 大小:383.37KB
返回 下载 相关 举报
本章中将学习到如下内容.ppt_第1页
第1页 / 共33页
本章中将学习到如下内容.ppt_第2页
第2页 / 共33页
本章中将学习到如下内容.ppt_第3页
第3页 / 共33页
本章中将学习到如下内容.ppt_第4页
第4页 / 共33页
本章中将学习到如下内容.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《本章中将学习到如下内容.ppt》由会员分享,可在线阅读,更多相关《本章中将学习到如下内容.ppt(33页珍藏版)》请在金锄头文库上搜索。

1、第二章 XML语法本章中将学习到如下内容:v 如何编写和读取XML文档v XML是如何对文档进行格式化的v 在那里使用XML,以及如何使用XML严格的语法!严格的语法!一、一、XML基础语法基础语法vXML用结构化结构化方式来交换交换和发布发布信息的一组标准。 vXML是一种用来描述和操作符合某种结构的文档 的语言。1、XML标记初步标记初步一、一、XML基础语法基础语法 John Doe 34 Fountain Square Plaza OH 45202 Cincinnati US 513-744-8889 513-744-7098 (pro2.1 abook.xml)一、一、XML基础语

2、法基础语法1、XML标记初步标记初步Analysis pro2.1 abook.xmlConclusionXML文档文档 = 由字符数据和标记两部分组成的文本由字符数据和标记两部分组成的文本字符数据是我们需要的信息;字符数据是我们需要的信息;标记记录了文档的结构;标记记录了文档的结构; XML文档所具有的数据结构数据结构:元素组成的树。树的深度没有限制,而且元素可以重复。 John Doe 34 Fountain Square Plaza OH 45202 Cincinnati US 513-744-8889 513-744-7098 (pro2.1 abook.xml)一、一、XML基础语

3、法基础语法1、XML标记初步标记初步John Doe34 Fountain Square PlazaCincinnati,OH 45202US513-744-8889(preferred)513-744-7098J(pro 2.2 abook.txt)Analysispro2.1与pro2.2表达的是相同的信息。但是,软件不具备人的识别能力,应用程序无法处理pro2.2显然:显然: pro2.2 abook.txt不包含结构信息。标记将XML文档和普通的文本文件区分开;标记将文本划分为更容易被软读取的元素;一、一、XML基础语法基础语法1、XML标记初步标记初步标记的作用:标记的作用:1)元素

4、的开始标记和结束标记元素的开始标记和结束标记元素element:是XML文档的基本组成单位。元素的结构:Tianshui Road 开始标记结束标记(元素内容)元素名称是由用户命名的,XML规范中规定了如何定义元素,并没有定义元素。一、一、XML基础语法基础语法1、XML标记初步标记初步1)元素的开始标记和结束标记元素的开始标记和结束标记Yada yada yada. Yada yada yada. . 以上的标记是不合乎规则的,没有段落结束标记这在HTML中可以接受,但XML解析器会拒绝它。XML文档中,不能省去任何结束标记!文档中,不能省去任何结束标记!2)XML中的名称中的名称元素的命名

5、规则:元素的命名规则:一、一、XML基础语法基础语法1、XML标记初步标记初步以字母或下划线(“_”)开头的,字母、数字、下划线、点(“.”)、 或连字符(“-”)的字符串;名称中不能使用空格; 不能以字符串“xml”作为开头;(XML规范本身使用)可以使用冒号(“:”),专用在名称空间中。 大小写敏感; 两个比较流行的约定两个比较流行的约定: : 完全用小写字母来书写名称,当名称中包含多个单词时, 用连字符隔开,如address-book。 每个单词的首字母大写,不使用分隔符,如AddressBook 只是约定而已,不是规范! 一、一、XML基础语法基础语法1、XML标记初步标记初步2)XM

6、L中的名称中的名称下面是一些合法的元素名称:,下面是一些不合法的元素名称:,Elements are case sensitive Elements are case sensitive 分析以下两段代码:HTML中允许XML不允许一、一、XML基础语法基础语法1、XML标记初步标记初步3)空空元素元素没有内容的元素称为空元素空元素。通常(不是必须)空元素具有属性。HTML中的换行和图像元素就是空元素。简写成一、一、XML基础语法基础语法1、XML标记初步标记初步4)根元素根元素XML文档必须包含在一个单一元素内,这个单一元素称为根元素根元素。它包含文档中所有文本和所有其它元素。 Hello,

7、World!XML包含在一个根元素中。注释语句一、一、XML基础语法基础语法1、XML标记初步标记初步4)根元素根元素 Hello,World! Hola, el Mundo!此文档不包含单一根元素,不管该文档可能包含什么信息,XML解析器会拒绝它。Question 如何改正上述文档?一、一、XML基础语法基础语法1、XML标记初步标记初步5)属性属性属性属性是为元素添加的附加信息,属性由名称名称和值值组成。XML文档中的属性有两个规则: 属性必须有值; 值必须用引号引号括起来;XML解析器会拒绝!引号可以是单引号、或双引号,但XML文档必须保持一致。一、一、XML基础语法基础语法1、XML标

8、记初步标记初步5)属性属性使用另一种引号。Question 如果属性值中包含单引号或双引号,怎么办? Solution1Solution2实体引用实体"代表双引号;实体'代表单引号;一、一、XML基础语法基础语法1、XML标记初步标记初步6)元素嵌套元素嵌套子元素:子元素:包含在另一个元素中的元素。父元素:父元素:包含子元素的元素称为父元素。 Jack Smith 513-744-3465 Never leave message on his entry元素有三个子元素: name,tel,comments。一、一、XML基础语法基础语法1、XML标记初步标记初步6)元素嵌

9、套元素嵌套 I really love XML. (I) I really love XML. (II)在元素中开始了元素,必须在中结束它。大多数HTML解析器接受。但XML解析器拒绝。规定:起始和结束标记必须配对;子元素必须完整地包含在 父元素中;一、一、XML基础语法基础语法1、XML标记初步标记初步7)XML声明声明XML声明是文档的第一行。大多数XML文档以XML声明声明作为开始,它向解析器提供了关于文档的基本信息。(建议使用,但它不是必需的)声明最多可以包含三个名称-值对。(“属性”,但技术上不是)版本1.0文档所使用的字符集ISO-8859-1大多数西欧字符;UTF-8(默认)支持

10、所有语言的字符;(Unicode标准)定义了是否可以在不读取任何其它文件的情况下处理该文档。默认值为no。2、XML文档中的其它项文档中的其它项8)注释注释一、一、XML基础语法基础语法注释以结束。 注释可以出现在文档的任何位置,包括根元素的前面或后面。注意:注意: 注释不能在结束部分以外包含双连字符( - ), 除此之外,注释可以包含任何内容。 注释内容将被解析器忽略,即注释内的标记也会被忽略。一、一、XML基础语法基础语法2、XML文档中的其它项文档中的其它项9)处理指令处理指令(Processing Instruction,PI)处理指令是为使用一段特殊代码而设计的标记。处理指令包含在中

11、。第一个单词是目标,它指明该指令所针对的应用程序或设备。剩余部分是目标专用格式,这一部分不一定必须是XML。P43一、一、XML基础语法基础语法2、XML文档中的其它项文档中的其它项10)UnicodeUnicode是由统一编码联盟(Unicode Consortium)发布的,它是对ASCII字符集进行的一项扩展。http:/www.unicode.org国际标准化组织ISO也发布了同一个标准,ISO/IEC 10646Unicode支持所有的语言(地球上存在的)以及数学和其他符号。支持英语、西欧语言、西里尔语、日语、汉语等等。ASCII字符集: 8 byte - 一个字符;Unicode字

12、符集:16 byte - 一个字符;Question XML文档比普通文本大一倍吗?一、一、XML基础语法基础语法2、XML文档中的其它项文档中的其它项10)UnicodeConclusion 理论上是; 实际中:大多数并不需要16位;XML能够识别两种编码:UTF-8和UTF-16UTF-8:为英语使用8位,其他字符使用16位或24位;UTF-16:对所有的字符都按16位编码。ISO8859-1,即Latin-1,Windows默认字符集。除了UTF-8和UTF-16外,需使用encoding指出所使用的编码。一、一、XML基础语法基础语法2、XML文档中的其它项文档中的其它项11)实体实体

13、(entity)XML中使用实体在物理上为文档进行组织,实体有时候等价于文件,有时候是字符串。用法:用法:通过实体引用来将实体(entity reference)插入文档中。 &+实体名称实体名称+;Example 如:已经定义了实体“us”的值为“United States”, 则以下两行代码等价。&us;United States一、一、XML基础语法基础语法2、XML文档中的其它项文档中的其它项11)实体实体(entity)预定义的实体:1)< 4)' 属性值中的单引号5)" 属性值中的双引号“Marks & Spencer 解析器无法解析&Marks &

14、; Spencer二、二、XML语法补充语法补充1、特殊属性、特殊属性xml:space 作用:作用:告诉XML解析器,空格该如何处理。取值:取值:preserve 保留所有的空格 default 忽略重复的空格 XML规范中,空格是四种字符的任意组合序列:空格字符(space),对应字符值为#x20返回字符(Carriage Return),对应字符值为#xD新行字符(Newline),对应字符值为#xA跳格字符(Tab),对应字符值为#x92、特殊属性、特殊属性xml:lang作用:作用:标识文档(元素)的内容是何种语言。本地化:本地化:能够根据一组特定的语言和文化习惯来定制 表示信息的方

15、法。 Orange juice Jugo de naranja Toast Pan tostada二、二、XML语法补充语法补充3、CDATA节节作用作用:解析器会忽略CDATA中的转义字符。规范规范:CDATA节用“”进行界定。普通字符普通字符二、二、XML语法补充语法补充4、代码缩进、代码缩进作用作用: (对人)增强了代码的可读性,解析器并不需要它。 Smith 513-1234 (I)Smith513-1234 (II)Analysis二、二、XML语法补充语法补充Smith513-1234 (II)解析器将代码处理成树型结构(IE以树型结构显示)。注意:注意:应用程序处理时,将不一样。

16、二、二、XML语法补充语法补充5、XML和语义和语义 John Doe 34 Fountain Square Plaza OH 45202 Cincinnati US 513-744-8889 513-744-7098 XML的语义是由应用程序来提供的。三、三、XML的的两种应用两种应用1、发布、发布 目前,越来越多的在线出版商采用XML作为文档的格式。对发布文档而言,XML的优势有:XML文档可以“自动”转换成别的媒体格式, pdf,Web,打印等。对大量的文档而言,通用结构的使用简化了编辑工作。文档的结构与表现分离。三、三、XML的的两种应用两种应用2、电子商务、电子商务 2000-03-10 AGL153 2000-04-10 0789725045 XML by Example 15 29.99 应用程序可以扫描订单,识别出产品代码和定购数量。更多资源http:/

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号