Xml简介_动力节点Java学院整理

XML(简介)

XML(可扩展标记语言)在 20 世纪 90 年代后期登上舞台后,就一直是众多活动和狂热思索的焦点。XML 只是基于普通文本,但却提供了几乎可以在任何两个应用程序间共享数据的方式。

虽然 XML 在概念上很简单,但对 XML 的处理却通常很烦琐(需要编写大量重复性的代码)和复杂(很多容易被忽视的细节导致错误)。

什么时候使用 XML?

什么时候在Web 应用程序中使用 XML?

  • 你需要处理已经保存在 XML 中的数据时。
  • 你希望用 XML 保存数据并为将来可能的整合做准备时。(XML 在应用程序整合的场景中最有意义)
  • 你希望使用依赖于 XML 的技术时。(Web 服务使用各种建立在 XML 上的标准)
  • 注解:
  • 必须理解的一个重要概念是,存储数据时必须决定两件事情:
  • 确定数据结构化的方式(逻辑格式)
  • 确定数据保存的方式(物理存储)

 XML 是格式的选择而不是存储的选择。也就是说,即使你决定用 XML 保存数据,你还要决定是保存到数据库字段里,还是要插入到一个文件里,或者只是以字符串或其他对象的形式保存在内存中。

XML 简介

XML 规范是由 W3C(World Wide Web Consortium)定义的一组指南,用于以纯文本的形式描述结构化数据,一种基于尖括号间标签的标记语言。

XML 没有一组固定的标签。相反,XML 是一种可用于创建其他标记语言的元语言。

下面的文档显示一个保存产品类别的自定义 XML 格式:

<?xml version="1.0" encoding="utf-8" ?>
<productCatalog>
 <catalogName>Acme Fall 2015 Catalog</catalogName>
 <expiryDate>2015-01-01</expiryDate>
 <products>
  <product id="1001">
   <productName>Magic Ring</productName>
   <productPrice>342.10</productPrice>
   <inStock>true</inStock>
  </product>
  <product id="1002">
   <productName>Flying Carpet</productName>
   <productPrice>982.99</productPrice>
   <inStock>true</inStock>
  </product>
 </products>
</productCatalog>

标签可以自由使用最能描述你的数据的任意名称,正是这种灵活性使得 XML 非常成功。当然,灵活性也会有缺点。不同公司完全可用不同的标签名来描述相似的数据,尽管所有应用程序都能够解析 XML 数据,但数据的写入者和读取者需要对标签和结构达成共识,才能使读取者可用解释数据并抽取有意义的信息。

XML 的优点

今天,XML 比过去任何一天都更为有用。现代应用程序使用 XML 的好处有以下几点:

  • 适应性。XML 无处不在,无论什么时候需要共享数据,XML 都会成为首选目标。
  • 扩展性和灵活性。XML 不会强加任何数据语义的规则,适用于任意数据的类型并且实现的代价很低。
  • 相关标准和工具。XML 成功的另一个原因在于创建和处理 XML 的工具(解析器)和相关标准(XML架构、XPath、XSLT)。这样几乎每种语言的开发者都有现成的组件用于阅读 XML,按某种规则(被称作架构)验证 XML 的有效性,将 XML 转换格式等。

格式良好的 XML

XML 是一个非常严格的标准,这种严格性是用于保留广泛的兼容性的。(臭名昭著的 HTML 语言就是在没有这种严格性标准下的产物)

所有的 XML 解析器都会执行一些基本的质量检查。如果一个 XML 文档不能满足所有标准,它就会被彻底拒绝。否则,它就被认为是格式良好的。格式良好的 XML 未必就是正确的 XML ,例如含有错误数据,但 XML 解析器能够解析它。

XML 文档必须满足下面这些条件才能被认为是格式良好的:

  • 每个开始标签必须有一个对应的结束标签
  • 空元素必须以“/>”结束
  • 元素可以嵌套但不能交错
  • XML 是严格区分大小写的,因此 <FirstName> 和 </firstName > 不能配对
  • 一个元素不能有两个或更多的同名特性,但是可以嵌套多个同名的元素
  • 一个文档只可以有一个根元素
  • 所有特性在值的前后都要有引号
  • 注释不能放入标签中(它们包含在 <!-- 和  --> 标记中)

XML 命名空间

随着 XML 标准的成长,已创建了数十种 XML 标记语言(通常叫做 XML 语法)。其中很多属于特定的行业、流程和信息类型。如果你需要同时组合两个具有相同名称元素的 XML 语法,会发生什么呢?另一个更典型的问题是如何区分它们?

解决办法在于 XML 命名空间标准。这个标准的核心思想是所有的 XML 标记语言都拥有能够唯一区分相关元素的命名空间。简单的说,命名空间可以在整合时消除同名元素的歧义。

所有的 XML 命名空间都使用 URI(Universal Resource Identifiers,统一资源标识符),一般看起来和网页的 URL 相似。例如,http://www.mycompany.com/mystandard 是一种典型的命名空间,但这不是必要的(也不应该被假设),命名空间可以是任意文本序列,标准是为了确保它的唯一性。

要指定某个元素属于特定的命名空间,只需在开始标签中加入 xmlns(XML Name Space)特性表明要使用的命名空间即可。例如,下面这个元素是http://mycompany/OrderML 命名空间的一部分。

<order xmlns="http://mycompany/OrderML"></order>
    你一定会厌倦在所有元素上加入这个特性的烦琐操作,幸好,如果像下面这样加入命名空间,它会成为所有子元素默认的命名空间:
<product xmlns="http://mycompany/OrderML">
 <productName>Flying Carpet</productName>
 <productPrice>982.99</productPrice>
 <inStock>true</inStock>
</product>
    你还可以自定义命名空间前缀,在 xmlns 特性中插入一个冒号和一个你想用作前缀的字符:
<ord:order xmlns:ord="http://mycompany/OrderML"
      xmlns:cli="http://mycompany/ClientML">
 <cli:client>
  <cli:firstName>...</cli:firstName>
  <cli:lastName>...</cli:lastName>
 </cli:client>
 <ord:orderItem>...</ord:orderItem>
 <ord:orderItem>...</ord:orderItem>
</ord:order>

XML 架构

XML 的灵活性也带来了一些问题。世界各地的开发人员都使用你的 XML 格式,怎样才能保证所有人都遵守规则?

解决办法是创建一个格式文档,它定义你的自定义标记语言的规则,它被称为架构。这些规则不会包括语法细节(那是 XML 标准所要规定的),架构文档需要定义的是符合你的数据类型的逻辑规则,它包括以下几项:

  • 文档词汇。它定义了哪些元素或特性的名字可以出现在你的 XML 文档中。
  • 文档结构。它定义了标签放在哪儿,可以指定标签之间的顺序,还可以指定某个元素可以出现的次数。
  • 支持的数据类型。可以定义数据是文本,或者必须是可以解析的数值数据、日期信息等。
  • 允许的数据范围。可将数值限制在范围内,文本限定在特定长度内,强迫正则表达式模式匹配,或者限制仅可以是某些特定的值。

下面的这个 XML 架构定义了前面所示的产品类别规则:

<?xml version="1.0" encoding="utf-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
 <xsd:element name="productCatalog">
  <xsd:complexType>
   <xsd:sequence>
    <xsd:element name="CatalogName" type="xsd:string" />
    <xsd:element name="expiryDate" type="xsd:date" />
    <xsd:element name="products">
     <xsd:complexType>
      <xsd:sequence>
       <xsd:element name="product" type="productType" maxOccurs="unbounded" />
      </xsd:sequence>
     </xsd:complexType>
    </xsd:element>
   </xsd:sequence>
  </xsd:complexType>
 </xsd:element>
 <xsd:complexType name="productType">
  <xsd:sequence>
   <xsd:element name="productName" type="xsd:string" />
   <xsd:element name="productPrice" type="xsd:decimal" />
   <xsd:element name ="inStock" type="xsd:boolean" />
  </xsd:sequence>
  <xsd:attribute name="id" type="xsd:integer" use="required" />
 </xsd:complexType>
</xsd:schema>
  • 所有的架构文档都是以根元素 <schema> 开头的 XML 文档
  • 所有可用的元素都已经在 XML 架构空间定义了(http://www.w3.org/2001/XMLSchema
  • 你的架构文档必须使用正确的命名空间名(前缀一般是 xsd 或 xs ,你也可以自定义)
  • 在 <schema> 元素内,有两种类型的定义
  • <element> 定义目标文档必须遵循的结构
  • <complexType> 定义文档结构较小的数据结构
  • <element>标签是架构的核心,同时它也是所有验证的起点

在这个示例中,<element>标签确定产品类别必须以一个叫做<productCatalog>的根元素开始。<productCatalog>元素内部是一个由3个元素组成的序列。第一个是<catalogName>,它包含普通文本;第二个是<expiryDate>,它包含符合日期呈现规则的文本;第三个是<products>,它包含<product>元素的列表。

每个<product>元素都是一个复杂的类型,因此文档后面又使用<complexType>进行了定义。这个复杂类型(名为<productType>)由含有产品信息的 3 个元素所组成的序列构成。这些元素分别保存文本(<productName>)、十进制数(<productPrice>)、布尔值(<inStock>)。这个复杂类型还包括一个必须的特性 id。

(0)

相关推荐

  • XML简介

    所谓的xml,就是eXtensible Markup Language, 翻译成中文就是"可扩展标识语言",在国内很多人理解xml为html的简单扩展,这实际上是一种误解.尽管xml同html关系非常密切.   XML与SGML.HTML的关系.    SGML.HTML是XML的先驱.SGML是指"通用标识语言标准"(Standard Generalized Markup Language), 它是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构

  • XMLHTTPRequest的属性和方法简介

    而设计AJAX时使用的一个重要的技术(工具)就是XMLHTTPRequest对象了.这里海啸把我学习XMLHTTPRequest对象的一点资料拿出来跟大家一起分享.文中的资料都是海啸在学习时在网上收集的,如果您开过,那就再加深下印象吧!(如果您觉得侵犯了您的版权,请联系海啸.(haixiao_yao[at]yahoo.com.cn)) 1.XMLHTTPRequest对象什么是? 最通用的定义为:XmlHttp是一套可以在Javascript.VbScript.Jscript等脚本语言中通过ht

  • 气象 XML 数据源应用程序开发指南-简介

    2.简介 2.1. 关于气象 XML 数据源 气象 XML 数据源(服务)允许第三方应用程序通过 weather.com® 站点请求一个 XML feed 访问一个可用的数据子集.Weather Channel Interactive 公司 (TWCi) 提供这个用于开发的免费的数据,谁要将气象数据应用到一个单一的应用程序那么希望可以和 weather.com 交换链接.这个文档描述了怎样使用气象数据并且从技术上详述请求和使用这个 XML 数据.气象数据包含:- 通过城市/州和邮政编码搜索区域-

  • [转]XMLHTTPRequest的属性和方法简介

    1.XMLHTTPRequest对象什么是? 最通用的定义为:XmlHttp是一套可以在Javascript.VbScript.Jscript等脚本语言中通过http协议传送或从接收XML及其他数据的一套API.XmlHttp最大的用处是可以更新网页的部分内容而不需要刷新整个页面.(这个功能正是AJAX的一大特点之一:)) 来自MSDN的解释:XmlHttp提供客户端同http服务器通讯的协议.客户端可以通过XmlHttp对象(MSXML2.XMLHTTP.3.0)向http服务器发送请求并使用

  • 简介C#读取XML的两种方式

    XML作用 对于XML,想必各位都比较了解,我也就不用费笔墨来描述它是什么了,我想在未来的Web开发中XML一定会大放异彩,XML是可扩展标记语言,使用它企业可以制定一套自己的数据格式.用于Internet的数据传输,我想,这是XML对于我们这些程序员最诱人的地方! 我们今天的主题不是论述XML的好处,而是讨论在C#中如何使用XML.下面我们来了解一下使用程序访问XML的一些基础理论知识. 访问的两种模型: 在程序中访问进而操作XML文件一般有两种模型,分别是使用DOM(文档对象模型)和流模型,

  • 简介Objective-C解析XML与JSON数据格式的方法

    解析XML 本文以解析本地XML为例,网络获取到的返回值只需转换成NSData型,解析是同理 需要解析的xml文件如下,users.xml <?xml version="1.0" encoding="UTF-8"?> <AllUsers> <message>用户信息</message> <user> <name>芳仔小脚印</name> <age>10</age&g

  • Xml简介_动力节点Java学院整理

    XML(简介) XML(可扩展标记语言)在 20 世纪 90 年代后期登上舞台后,就一直是众多活动和狂热思索的焦点.XML 只是基于普通文本,但却提供了几乎可以在任何两个应用程序间共享数据的方式. 虽然 XML 在概念上很简单,但对 XML 的处理却通常很烦琐(需要编写大量重复性的代码)和复杂(很多容易被忽视的细节导致错误). 什么时候使用 XML? 什么时候在Web 应用程序中使用 XML? 你需要处理已经保存在 XML 中的数据时. 你希望用 XML 保存数据并为将来可能的整合做准备时.

  • Java字符编码简介_动力节点Java学院整理

    1. 概述 本文主要包括以下几个方面:编码基本知识,Java,系统软件,url,工具软件等. 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687".注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示". 2. 编码基本知识 最早的编码是iso88

  • Nginx简介_动力节点Java学院整理

    1.什么是Nginx Nginx来自俄罗斯的Igor Sysoev在为Rambler Media(http://www.rambler.ru/)工作期间,使用C语言开发了Nginx.Nginx作为Web服务器,一直为俄罗斯著名的门户网站Rambler Media提供着出色.稳定的服务. Igor Sysoev将Nginx的代码开源,并且赋予其最自由的2-clause BSD-like license许可证.由于Nginx使用基于事件驱动的架构能够并发处理百万级别的TCP连接,高度模块化的设计和自

  • Java Map简介_动力节点Java学院整理

    Map简介 将键映射到值的对象.一个映射不能包含重复的键:每个键最多只能映射到一个值.此接口取代 Dictionary 类,后者完全是一个抽象类,而不是一个接口. Map 接口提供三种collection 视图,允许以键集.值集或键-值映射关系集的形式查看某个映射的内容.映射顺序 定义为迭代器在映射的 collection 视图上返回其元素的顺序.某些映射实现可明确保证其顺序,如 TreeMap 类:另一些映射实现则不保证顺序,如HashMap 类. 注:将可变对象用作映射键时必须格外小心.当对

  • Java中Object toString方法简介_动力节点Java学院整理

    一.Object类介绍  Object类在Java里面是一个比较特殊的类,JAVA只支持单继承,子类只能从一个父类来继承,如果父类又是从另外一个父类继承过来,那他也只能有一个父类,父类再有父类,那也只能有一个,JAVA为了组织这个类组织得比较方便,它提供了一个最根上的类,相当于所有的类都是从这个类继承,这个类就叫Object.所以Object类是所有JAVA类的根基类,是所有JAVA类的老祖宗.所有的类,不管是谁,都是从它继承下来的. 二.toString方法介绍  一个字符串和另外一种类型连接

  • Java Set简介_动力节点Java学院整理

    1. 概述   Java 中的Set和正好和数学上直观的集(set)的概念是相同的.Set最大的特性就是不允许在其中存放的元素是重复的.根据这个特点,我们就可以使用Set 这个接口来实现前面提到的关于商品种类的存储需求.Set 可以被用来过滤在其他集合中存放的元素,从而得到一个没有包含重复新的集合. 2. 常用方法 按照定义,Set 接口继承 Collection 接口,而且它不允许集合中存在重复项.所有原始方法都是现成的,没有引入新方法.具体的 Set 实现类依赖添加的对象的 equals()

  • RandomAccessFile简介_动力节点Java学院整理

    RandomAccessFile RandomAccessFile 是随机访问文件(包括读/写)的类.它支持对文件随机访问的读取和写入,即我们可以从指定的位置读取/写入文件数据. 需要注意的是,RandomAccessFile 虽然属于java.io包,但它不是InputStream或者OutputStream的子类:它也不同于FileInputStream和FileOutputStream. FileInputStream 只能对文件进行读操作,而FileOutputStream 只能对文件进

  • Java7之forkjoin简介_动力节点Java学院整理

    Java7引入了Fork Join的概念,来更好的支持并行运算.顾名思义,Fork Join类似与流程语言的分支,合并的概念.也就是说Java7 SE原生支持了在一个主线程中开辟多个分支线程,并且根据分支线程的逻辑来等待(或者不等待)汇集,当然你也可以fork的某一个分支线程中再开辟Fork Join,这也就可以实现Fork Join的嵌套. 有两个核心类ForkJoinPool和ForkJoinTask. ForkJoinPool实现了ExecutorService接口,起到线程池的作用.所以

  • Java List简介_动力节点Java学院整理

    Java中可变数组的原理就是不断的创建新的数组,将原数组加到新的数组中,下文对Java List用法做了详解.  List:元素是有序的(怎么存的就怎么取出来,顺序不会乱),元素可以重复(角标1上有个3,角标2上也可以有个3)因为该集合体系有索引  ArrayList:底层的数据结构使用的是数组结构(数组长度是可变的百分之五十延长)(特点是查询很快,但增删较慢)线程不同步  LinkedList:底层的数据结构是链表结构(特点是查询较慢,增删较快)  Vector:底层是数组数据结构 线

  • jQuery Autocomplete简介_动力节点Java学院整理

    jQuery UI Autocomplete是jQuery UI的自动完成组件,是我用过的最强大.最灵活的Autocomplete,它支持本地的Array/JSON数组.通过ajax请求的Array/JSON数组.JSONP.以及Function(最灵活)等方式来获取数据. 支持的数据源 jQuery UI Autocomplete主要支持字符串Array.JSON两种数据格式. 普通的Array格式没有什么特殊的,如下: ["bjpowernode","动力节点"

随机推荐