二章XML语言讲课资料

上传人:yulij****0329 文档编号:137910444 上传时间:2020-07-12 格式:PPT 页数:133 大小:901KB
返回 下载 相关 举报
二章XML语言讲课资料_第1页
第1页 / 共133页
二章XML语言讲课资料_第2页
第2页 / 共133页
二章XML语言讲课资料_第3页
第3页 / 共133页
二章XML语言讲课资料_第4页
第4页 / 共133页
二章XML语言讲课资料_第5页
第5页 / 共133页
点击查看更多>>
资源描述

《二章XML语言讲课资料》由会员分享,可在线阅读,更多相关《二章XML语言讲课资料(133页珍藏版)》请在金锄头文库上搜索。

1、第二章 XML语言,第一节 XML概述 第二节 XML语法 第三节 DTD 第四节 Schema 第五节 Namespace 第六节 XSL 第七节 XML的应用 第八节 其他,如何表示信息?,如何表示信息?,如何表示信息?,计算机与人均可读的信息表示, 国民党研究续集 中国友谊出版公司 1999-01-01 11.4 元 李敖议坛衰思录 中国友谊出版公司 2009-01-01 31.6 元 李敖有话说 中国友谊出版公司 2007-01-01 11.4 元 ,演示:, ,第一节、XML概述,XML介绍 XML的组成,XML介绍,XML: eXtensible Markup Language 中

2、文译为“可扩展标记语言”,是用于标记电子文件使其具有结构性的标记语言。 是SGML(Standard generalized markup language) 的一子集.,标记 读书时,为了突出重点,可以用彩色笔把某些句子加亮,或者下划线。 文字编辑器借助置标来定义格式与外观 通信程序依靠置标理解所传输信息的语意 数据库通过置标来将数据字段与一定的含义相连,并表明字段之间的关系,标记语言 一种用来给文本添加标记的语言。 置标 用标记语言对数据进行编码的过程。,GML(Generalized Markup Language) 2 0世纪6 0年代,I B M公司创建了第一个标识文档的通用标记语言

3、GML。 最初,GML只被用于IBM内部文档。,SGML 随着众多企业采用GML,它被扩展为标准通用标记语言SGML (Standard Generalized Markup Language)。 1986年,国际标准化组织把SGML确定为ISO http:/www.iso.org/ SGML特点 SGML包含一系列的文档类型定义(简称DTD) SGML是可以扩展; SGML十分复杂,不易学习使用,计算机实现也十分困难。,HTML 1989年,欧洲核子物理研究中心在SGML基础上提出HTML(HyperText Markup Language )。 HTML包含一组事先定义好的标签,每个标签表

4、明一定的显示格式。 例如: 被置标后的HTML文件,同时包含文本及文本显示格式信息。 HTML文件由专门处理工具进行读取、显示。,HTML 特点 HTML只使用SGML中很小一部分标签 HTML规定的标签是固定的,不可扩展,它不需包含DTD。 HTML简单、易学易用 HTML使 Web 技术从计算机界走向千家万户,从SGML到HTML,从MARC到DC,从Z39.50到SRU,W3C推出精简SGMLXML HTML过于简单的语法无法表现复杂的形式,不能满足不断增长的需求。 SGML太庞大,用户学、用不方便,且要全面实现SGML的浏览器又非常困难。,XML XML是一种比HTML更强大的标记语言

5、 XML同样依赖于描述一定规则的标签和能够读懂这些标签的处理工具。 XML是可扩展的标记语言 与HTML事先定义好固定标签不同,XML提供一个标签标准,用户可以根据实际需要自行定义新的标签。,XML目标 在互联网上直接使用(类似于HTML)。 支持各种不同的应用方式(浏览、内容分析)。 与SGML兼容(SGML是XML的直接先驱)。 处理XML文件的应用程序应该容易编写。 XML文件具有良好的可读性(HTML的易读性很差)。 用XML设计新的标记语言应该方便快捷(不必再去经历标准制定程序) XML文件应该容易编制(借助普通编辑工具就能编写)。 XML标记的简洁性并不重要(不必再去费尽心机减少标

6、记)。,XML 1998年XML1.0成为W3C推荐标准 http:/www.w3.org/TR/1998/REC-xml-19980210 XML 1.0 (Fifth Edition) http:/www.w3.org/TR/REC-xml/,第一节、XML概述,XML简史 XML组成 XML的优点,XML文档组成,三部分 标记描述 XML数据文件(.XML) 置标语法 DTD/Schema文件(.DTD/.XSD) 置标含义 XSL文件(.XSL),XML,DTD/XSD,XSL,理解结构,获得语义,XML标记描述,分两类 一类偏重于语意描述 XML看上去和HTML非常相象,但XML标签

7、具有语义,支持相关工具的语义解析。 一类偏重于显示方式描述,包括: 文本描述 矢量图形、图象、声音描述等, 张三 001 A公司 (010)62345678 五街1234号 北京 北京 100001 . ,XML标记文档实例,置标语法,DTD(Document Type Definition) 置标语法是通过文件类型定义DTD来描述的,即通过DTD来描述什么是有效的标签。 DTD语法定义文件与XML数据标记文件是分离的。,DTD文档:contact.dtd, 张三001A公司(010)62345678 北京 北京 五街1234号 ,XML标记文档:list.xml,置标含义,样式单(Style

8、 Sheet) 为明确各个标签含义,XML使用样式单来向应用程序提供如何处理显示的指示说明。, F公司的客户联系信息 用户ID: 公司: EMAIL: 电话: ,样式单实例,将XML文档中的标签转换为HTML中的标签; 将XML文档中的 、等标签转换为HTML中的标签。,XML核心内容 XML Specification: http:/www.w3.org/TR/2006/REC-xml-20060816/ W3C推荐标准,定义XML基本语法规范 XML Namespace: http:/www.w3.org/TR/REC-xml-names/ 提供一种统一命名XML文档中的元素和属性的机制,

9、避免来自不同标记词汇表的元素和属性之间冲突。 XML Schema:http:/www.w3.org/XML/Schema 用于定义和描述XML文档结构和内容模式,定义元素和元素之间的关系,定义元素和属性的数据类型。,XML Specification,XML Schema (DTD),XML Namespace,Application,XML应用体系结构,第一节、XML概述,XML简史 XML组成 XML的优点,XML的优点,可以自由地制定自己的置标语言 不必由有关的组织认可,不必开发专用的浏览器; 允许各个组织、个人建立适合他们自己需要的标记库,并且,这个标记库可以迅速地投入使用。,XML

10、的优点,从语义层次进行描述 便于修改 便于检索 便于处理 遵循严格的语法要求 便于书写、阅读 便于借助工具自动化处理, ,XML的优点,便于不同系统之间信息传输 可以标注多种信息类型 文字、图像、二进制文件等,XML的优点,具有较好的保值性 XML的保值性来自SGML语言,SGML最初设计目标是要为文件提供50年以上寿命。 电子文档的虽然能长期保存,但也存在隐患,处理软件升级导致打开文档的困难性。 如五十年以后,人们可能没有工具去打开用Word97写的文档。,XML与HTML的比较,第二章 XML语言,第一节 XML概述 第二节 XML语法 第三节 DTD 第四节 Schema 第五节 XML

11、命名空间 第六节 XSL 第七节 XML的应用 第八节 其他,第二节 XML语法,XML规则 逻辑结构 物理结构 参考资料: XML Specification (http:/www.w3.org/TR/REC-xml/),XML规则,基本规则 XML文档是由 Unicode 字符集组成的纯文本文档。 XML 文档具有良好结构。 XML文档区分大小写。 标记之间信息构成字符数据。 XML处理器不关心字符数据。 XML可为各种对象、应用程序定义语法和文件格式。,XML规则,格式良好性规则 XML 文档结构定义 遵循XML 规范 基于XML Specification规范构建的 XML 文档被称为

12、“具有良好格式的 XML文档”。 自定义 由文档作者自行创建结构文档 “DTD”或“XML Schema”; XML 处理器按照这个文档中的定义规则进行检验。,XML规则,格式良好性规则 (1)有且仅有一个根元素。 根元素也称文档元素,整个 XML 文档的其他元素都包含在根元素中,并通过嵌套形成树型结构。 除了根元素外,其他元素都是子元素。 (2)每个元素必须有开始标记和结束标记 开始标记的格式是: 结束标记的格式是: 空元素标记:,XML规则,格式良好性规则 (3)元素必须正确嵌套 元素嵌套时不允许交叉,最先出现开始标记的元素,其结束标记最后出现。 (4)所有属性值必须放在双引号或单引号中。

13、 (5)如果文档没有 DTD,在缺省情况下,所有属性值的类型必须是“CDATA”。,有效性规则 如果 XML 文档中元素出现的个数、顺序以及元素包含的内容都符合 DTD或XML Shema规则,则该文档就是有效的。 一个 DTD 或 XML Shema 可以被多个XML 文档共享,既保证了 XML 文档结构的标准化,又大大减少编写代码的工作负担。,DTD,XML,XML,XML,XML规则,命名规则 所有 XML命名都必需以字母、下划线或冒号开头。 用作命名空间时才以冒号做分隔符。 如: dc:title 保留字用户不使用 如:“ XML”、“xml”,XML规则,第二节、 XML的语法,XM

14、L规则 逻辑结构 物理结构,XML文件的逻辑结构,XML 文档组成 文档头部 声明 注释 处理指令 文档类型定义 文档主体 由一个或多个元素组成; 每个元素可以有子元素。,XML实例 1 2 3 4 5 XML 6 XML是一种可扩展的源置标语言, 它可用以规定新的置标规则,并根 据这个规则组织数据 7 8 9 11 张三 12 13 14 15 16,XML文档头部,文档头部可以包括 声明 注释 处理指令 文档类型定义,XML文档头部,(1)XML 声明 一个 XML 文档通常以一个XML声明开始,它指明XML版本等信息,必须出现在XML文档的第一行。 XML声明的作用就是告诉XML处理程序

15、:“当前文件是按照XML标准对数据进行置标的”。,XML文档头部,(1)XML声明 语法格式 实例 ,XML文档头部,(1)XML声明 属性 Version:必备属性 XML版本号,必须在属性列表中排在最前列。由于当前的XML最新版本是1.0,所以:version = “1.0” Standalone:可选属性 表明该XML文件是否还有一个配套置标声明文件 Standalone=“yes”:表示没有配套的DTD文件; Standalone=“no”,可能有这样一个文件(也可能没有) 缺省为: Standalone=“no” Encoding:可选属性 表明XML文档使用的字符编码标准,常见的有

16、: 简体中文码:GB2312 繁体中文码:BIG5 西欧字符: UTF-8,(2)处理指令(PI,Processing Instruction) 指导应用程序如何处理XML文件,格式: ?处理指令名 处理指令信息 ? 用于连接CSS样式单的PI格式 用于连接XSL样式单的PI格式 ,XML文档头部,(3)注释 XML 中使用注释对文档进行解释说明,增加程序的可读性,处理程序不对注释标记的内容进行处理。 语法 ,XML文档头部,(3)注释 使用注释规则 注释不能出现在声明之前 注释可以包容标记,使标记失去作用 注释不能出现在标记中 注释内容中不能包含“-” 以下是合法注释: -,XML文档头部,(4)文档类型定义 语法: 要求:文档类型定义必须出现在根元素标记符前面。 实例: 张三 ,XML文档头部,文档主体,文档主体组成 一个文档元素(根元素) 多个子元素 也可以有 PI 和注释,元素,XML元素

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号