xml语言基础---简单介绍

上传人:新** 文档编号:470153474 上传时间:2023-07-17 格式:DOC 页数:16 大小:523.50KB
返回 下载 相关 举报
xml语言基础---简单介绍_第1页
第1页 / 共16页
xml语言基础---简单介绍_第2页
第2页 / 共16页
xml语言基础---简单介绍_第3页
第3页 / 共16页
xml语言基础---简单介绍_第4页
第4页 / 共16页
xml语言基础---简单介绍_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《xml语言基础---简单介绍》由会员分享,可在线阅读,更多相关《xml语言基础---简单介绍(16页珍藏版)》请在金锄头文库上搜索。

1、XML解析一、 XML基础1) 什么是XMLl XML是指可扩展标记语言(eXtensible Markup Language),它也是一种标记语言,很类似HTML。它被设计的宗旨是存储数据,而非显示数据。l Html展示数据l XML标签没有被预定义,需要用户自行定义标签。l XML技术是W3C组织(World Wide Web Consortium万维网联盟)发布的,目前遵循的是W3C组织于2000年发布的XML1.0规范。l XML被广泛认为是继Java之后在Internet上最激动人心的新技术。请预览后下载!l W3CSchool(入门级)2) XML常见应用l 用于数据存储l 用在软

2、件配置,用于描述模块之间的关系(如果著名的Struts、Spring和Hibernate都是基于XML作为配置文件的-SSH)android都是xml。 图形界面都是用的xmll 在一个软件系统中,通过XML配置文件可以提高系统的灵活性。即程序的行为是通过XML文件来配置的,而不是硬编码。l XML是一种通用的数据交换格式。(跨平台)二、 XML语法语法较多,建议先直接上手写案例,成功之后再回来当回顾学习用一个XML文件主要包括以下几个部分:l 文档声明l 元素l 属性l 注释 l 实体引用及CDATA区 l 处理指令(PI:Processing Instruction)l Xml约束 请预览

3、后下载!1) 文档声明l 在编写XML文档时,需要先使用文档声明来声明XML文档。且必须出现在文档的第一行。(前面注释都不允许) 最简单的语法:l 用encoding属性说明文档所使用的字符编码。保存在磁盘上的文件编码要与声明的编码一致。 如:l 用standalone属性说明文档是否独立,即是否依赖其他文档。 如:2) 元素l XML元素指XML文件中出现的标签。一个标签分为起始和结束标签(不能省略)。一个标签有如下几种书写形式:n 包含标签主体:some content n 不含标签主体:(有时也叫空标签)n 一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许有交叉嵌套。n l

4、 一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或孙标签。请预览后下载!l 对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。例如:下面两段内容的意义是不一样的。ww.1000phone.copm ww.1000phone.copm -DOM解析l 由于在XML中,空格和换行都作为原始内容被处理,所以,在解析XML文件时要特殊处理下,绕过这些空格和换行符。l 元素命名规范:一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范n 区分大小写,例如,和是两个不同的标记。(与java、c变量命名一致)n 不能以数字或_ (下

5、划线)开头。n 不能以xml(或XML、或Xml 等)开头。(xml 为关键字,所以不能重复)n 不能包含空格。n 名称中间不能包含冒号(:)。n 一句话:像个正常人一样去写名称就行,不用关键字3) 属性l 一个元素可以有多个属性,每个属性都有它自己的名称和取值,例如:l 属性值一定要用引号(单引号或双引号)引起来。l 属性名称的命名规范与元素的命名规范相同请预览后下载!l 元素中属性没有顺序要求,但是不准重复。l 在XML技术中,标签属性所代表的信息也可以被改成用子元素的形式来描述4) 注释l XML中的注释语法为:l 注意:l XML声明之前不能有注释(xml声明必须放在文档第一行)l 注

6、释不能嵌套5) 实体引用及CDATA区实体引用l 在 XML 中,一些字符拥有特殊的意义。如果你把字符 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。如下这样会产生 XML 错误:if salary 1000 thenl 为了避免此类错误,需要把字符 替换为实体引用,就像这样:if salary < 1000 then在 XML 中有 5 个预定义的实体引用:< 大于&&和号'省略号"引号l 注意:严格地讲,在 XML 中仅有字符 和& 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。CDATA区术

7、语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。在 XML 元素中, 和 & 是非法的。 会产生错误,因为解析器会把该字符解释为新元素的开始。& 也会产生错误,因为解析器会把该字符解释为字符实体的开始。某些文本,比如 JavaScript 代码,包含大量 或 & 字符。为了避免错误,可以将脚本代码定义为 CDATA。CDATA 部分中的所有内容都会被解析器忽略。CDATA 部分由 结束:6) 处理指令(了解即可)l 处理指令,简称PI(Processing Instruction)。l 作用:用来指挥软件如何解析XML文档。l

8、语法:必须以“”作为结尾。l 常用处理指令:n XML声明:n xml-stylesheet指令:作用:指示XML文档所使用的CSS样式XSLT。请预览后下载!7) XML约束(了解即可)为什么需要约束:l XML都是用户自定义的标签,若出现小小的错误,软件程序将不能正确地获取文件中的内容而报错。什么是XML约束:l 约束文档定义了在XML中允许出现的元素名称、属性及元素出现的顺序等等。l 在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。l 常用的约束技术XML DTD, XML Schema l 作为普通工程师,一般是使用别人的约束文件,而不会自己去写约束

9、。例如使用SSH框架开始时用到的xml文件,均要受框架的提供的xml的约束文件的约束三、 SAX解析XML解析方式主要有:DOM(文档对象模型):将整个文件以树的结构存储到内存中,适合小文件,程序可读性高。Dom4j请预览后下载!SAX(基于事件流的解析):省内存,程序可读性相比上述较差。PULL(Android自带解析器):也是基于事件流的解析本次,我们只学习SAX和PULL两种方式正式来学习SAX解析Simple APIs for XML,XML简单应用程序接口,在javax.xml.parsers包中,SAX解析是JDK自带的解析方式,包括一组接口和类1) SAX解析原理以事件驱动的方式

10、解析,即找开始结束标签的方式SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。所以有两个关键点:顺序扫描,事件处理函数2) 案例:解析指定文件(标签无属性),并将文件中的信息存放到list中-需要先创建XML文件请预览后下载!请预览后下载!3) 案例:解析指定文件(根标签有属性),并将文件中的信息存放到list中假设:我们给每个phone加一个id属性,那么在解析根节点的时候,就需要获取到id信息并赋值给对象。请预览后下载!四、 PU

11、LL解析 在android系统中,很多资源文件中,很多都是xml格式,在android系统中解析这些xml的方式,是使用pul解析器进行解析的,它和sax解析一样,也是采用事件驱动进行解析的,同时,由于android内核已经内嵌了pull,所以我们不需要添加第三方的jar包来支持pull。1) 案例:解析XML文件(不带属性)首先,需要jar包:具体实现步骤如下:请预览后下载!基本上跟sax的解析思路是一样的。几个关键的方法强调下:获取其状态码,区分现在是哪个事件源(文档开头,文档结尾,标签开头,标签结尾)请预览后下载!获取标签名称获取标签的文本内容让指针继续往下解析下一个事件源2) 案例:解析XML文件(带属性)3) PULL vs SAX Pull解析器和SAX解析器虽有相似性但也有区别,他们的区别为:SAX解析器的工作方式是自动将事件推入注册的事件处理器进行处理,因此你不能控制事件的处理主动结束;而Pull解析器的工作方式为允许你的应用程序代码主动从解析器中获取事件,正因为是主动获取事件,因此可以在满足了需要的条件后不再获取事件,结束解析。请预览后下载!五、 作业解析books.xml文件,分别采用pull和sax的方式,要求独立编写完成。 (注:可编辑下载,若有不当之处,请指正,谢谢!) 请预览后下载!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号