XML入门的常见问题(四)

  在 XML 对象模型中如何处理空白字符?

  有些时候,XML 对象模型将显示包含空白字符的 TEXT 节点。空白字符被截断后,多半会带来一些混乱。例如下面的 XML 例子:

  ]>
  Smith
  John

  生成下列树:

  Processing Instruction: xml
  DocType: person
  ELEMENT: person
  TEXT:
  ELEMENT: lastname
  TEXT:
  ELEMENT: firstname
  TEXT:

  名字和姓氏两边是只包含空白字符的 TEXT 节点,因为“person”元素的内容模型是 MIXED;它包含 #PCDATA 关键字。MIXED 内容模型指定元素之间可以有文本存在。因此,下面的内容也是正确的:

  My last name is Smith and my first name is
  John

  结果是类似于下面的树:

  ELEMENT: person
  TEXT: My last name is
  ELEMENT: lastname
  TEXT: and my first name is
  ELEMENT: firstname
  TEXT:

  如果没有单词“is”之后和 之前的空白字符,以及 之后和单词“and”之前的空白字符,那么句子便无法理解。因此,对于 MIXED 内容模型来说,文字组合、空白字符和元素都是相关的。对于非 MIXED 内容模型来说则不是这样。

  要使只有空白字符的 TEXT 节点消失,请从“person”元素声明中删除 #PCDATA 关键字:

  结果是下面清晰的树:

  Processing Instruction: xml
  DocType: person
  ELEMENT: person
  ELEMENT: lastname
  ELEMENT: firstname

  XML 声明做什么?

  XML 声明必须列在 XML 文档的顶部:

  它指定下面的项目:

  该文档是 XML 文档。在丢失或者还没有指定 MIME 类型时 MIME 探测器可以用它来检测文件是否为类型 text/xml。
  文档符合 XML 1.0 规范。在以后 XML 有其他版本时这一点很重要。
  文档字符编码。编码属性是可选的,默认为 UTF-8。
  注意:XML 声明必须在 XML 文档的第一行,因此下面的 XML 文件:

  产生下面的分析错误:

  无效的 xml 声明。
  行 0000002:    
  位置  0000007: ------^
  注意:XML 声明是可选的。如果需要在顶部指定注释或者处理指令,那么请不要放入 XML 声明。但是,默认的编码将为 UTF-8。

  如何以可读格式打印我的 XML 文档?

  在用 DOM 从零开始构造文档以产生 XML 文件时,任何内容都在一行上,相互之间没有空格。这是默认的行为。

  构造在 Internet Explorer 5 中的默认 XSL 样式表,以可读格式显示和打印 XML 文档。例如,如果已经安装了 IE5,请尝试查看 nospace.xml 文件。浏览器中应该显示下面的树:

  -
  -
  XYZ
  12.56

  在 XML 中没有插入空白字符。

  打印可读 XML 是非常有趣的,特别是有定义不同类型内容模型的 DTD 时。例如,在混合内容模型 (#PCDATA) 下不能插入空格,因为它可能改变内容的含义。比如请考虑下面的 XML:

  Elephant
  这最好不输出为:

  E
  lephant
  因为单词边界不再正确。

  所有这些都使自动化打印成为问题。如果不需要打印可读 XML,那么可以使用 DOM 在适当的位置插入空白字符作为文本节点。

  如何在 DTD 中使用名称空间? 要在 DTD 中使用名称空间,请在使用它的元素的 ATTLIST 声明中声明它,如下所示:

  名称空间类型必须为 #FIXED。属性的名称空间也是这样:

  名称空间和 XML 架构
  DTD 和 XML 架构不能混合。例如,下面的

  xmlns:x CDATA #FIXED "x-schema:myschema.xml"

  将不导致使用在 myschema.xml 中定义的架构定义。对 DTD 和 XML 架构的使用是互斥的。

  如何在 Visual Basic 中使用 XMLDSO?

  使用下面的 XML 作为例子:

  Mark Hanson
  206 765 4583
  
  Jane Smith
  425 808 1111

  可以按如下方式绑定到 ADO 记录集:

  创建新的 VB 6.0 项目。

  添加对 Microsoft ActiveX Data Objects 2.1 或更高版本、Microsoft Data Adapter Library 和 Microsoft XML 2.0 版的引用。

  用下面的代码将 XML 数据加载到 XML DSO 控件中:

  Dim dso As New XMLDSOControl
  Dim doc As IXMLDOMDocument
  Set doc = dso.XMLDocument
  doc.Load ("d:\test.xml")

  用下面的代码将 DSO 映射到使用 DataAdapter 的新记录集对象中:

  Dim da As New DataAdapter
  Set da.Object = dso
  Dim rs As New ADODB.Recordset
  Set rs.DataSource = da

  访问数据:

  MsgBox rs.Fields("name").Value

  结果显示字符串“Mark Hanson”
  如何在 Java 中使用 XML DOM?

  必须已经安装 MSXML.DLL 的 IE5 版本。在 Visual J++ 6.0 中,从项目菜单选择添加 COM 包装程序,然后从 COM 对象列表中选择“Microsoft XML 1.0”。该操作将把所需的 Java 包装程序构造到称为“msxml”的新软件包中。这些预先构造的 Java 包装程序也可以下载。类可以按如下方法使用:

  import com.ms.com.*;
  import msxml.*;
  public class Class1
  {
  public static void main (String[] args)
  {
  DOMDocument doc = new DOMDocument();
  doc.load(new Variant("file://d:/samples/ot.xml"));
  System.out.println("Loaded " + doc.getDocumentElement().getNodeName());
  }
  }

  代码示例将从 sun religion 示例中加载 3.8MB 测试文件“ot.xml”。Variant 类用于包装 Win32 VARIANT 基本类型。

  因为在每次检索节点时实际上都获得了新的包装程序,因此不能在节点上使用指针比较。因此,不要使用下面的代码,

  IXMLDOMNode root1 = doc.getDocumentElement();
  IXMLDOMNode root2 = doc.getDocumentElement();
  if (root1 == root2)...

  而要使用下面的代码:

  if (ComLib.isEqualUnknown(root1, root2)) ....

  .class 包装程序的总大小大约为 160KB。但是,为了与 W3C 规范完全符合,应该只使用 IXMLDOM* 包装程序。下面的类是旧的 IE 4.0 XML 接口,可以从 msxml 文件夹中删除它们:

  IXMLAttribute*,
  IXMLDocument*, XMLDocument*
  IXMLElement*,
  IXMLError*,
  IXMLElementCollection*,
  tagXMLEMEM_TYPE*
  _xml_error*

  这使大小减少为 147KB。同时还可以删除下面的项目:

  DOMFreeThreadedDocument
  在 Java 应用程序中从多个线程访问 XML 文档。
  XMLHttpRequest
  用 XML DAV HTTP 扩展与服务器通信。
  IXTLRuntime
  定义 XSL 样式表脚本对象。
  XMLDSOControl
  绑定到 HTML 页面中的 XML 数据。
  XMLDOMDocumentEvents
  在分析过程中返回回调。

  这可以将大小减少到 116KB。要使它更小,请考虑 DOM 本身有两层的事实:核心层包括:

  DOMDocument, IXMLDOMDocument
  IXMLDOMNode*
  IXMLDOMNodeList*
  IXMLDOMNamedNodeMap*
  IXMLDOMDocumentFragment*
  IXMLDOMImplementation
  IXMLDOMParseError

  和用户可能需要保留的 DTD 信息:

  IXMLDOMDocumentType
  IXMLDOMEntity
  IXMLDOMNotation

  XML 文档中的所有节点类型都是 IXMLDOMNode,它提供全部功能,但是存在每种节点类型的更高级别的包装程序。因此,如果修改 DOMDocument 包装程序并将这些特定类型更改为使用 IXMLDOMNode,那么所有下面的接口都可以删除:

  IXMLDOMAttribute
  IXMLDOMCDATASection
  IXMLDOMCharacterData
  IXMLDOMComment
  IXMLDOMElement
  IXMLDOMProcessingInstruction
  IXMLDOMEntityReference
  IXMLDOMText

  删除这些将使大小减少到 61KB。但是,对 IXMLDOMElement 来说,getAttribute 和 setAttribute 方法都是有用的。否则需要使用:

  IXMLDOMNode.getAttributes().setNamedItem(...)

(0)

相关推荐

  • XML入门的常见问题(四)

    在 XML 对象模型中如何处理空白字符? 有些时候,XML 对象模型将显示包含空白字符的 TEXT 节点.空白字符被截断后,多半会带来一些混乱.例如下面的 XML 例子: ]> Smith John 生成下列树: Processing Instruction: xml DocType: person ELEMENT: person TEXT: ELEMENT: lastname TEXT: ELEMENT: firstname TEXT: 名字和姓氏两边是只包含空白字符的 TEXT 节点,因为&qu

  • XML入门的常见问题(一)

    作者:AngelGavin  出处:CSDN 一般问题 什么是 XML? 可扩展标记语言 (XML) 是 Web 上的数据通用语言.它使开发人员能够将结构化数据,从许多不同的应用程序传递到桌面,进行本地计算和演示.XML 允许为特定应用程序创建唯一的数据格式.它还是在服务器之间传输结构化数据的理想格式. 什么是 MSXML? MSXML 是提供核心 XML 服务的 Microsoft 软件组件. Microsoft XML 分析器能够做什么? 最新版本的 Microsoft 核心 XML 服务提

  • XML入门的常见问题(二)

    作者:AngelGavin  出处:CSDN Internet Explorer 5.0 对 XML 提供哪个级别的支持? Internet Explorer 5 提供下列 XML 支持: 直接查看 XML.Microsoft XML 实现允许用户通过他们的 Web 浏览器使用 XSL 或者层叠样式表 (CSS) 查看 XML,就象查看 HTML 文档一样. 高性能.验证 XML 引擎.Internet Explorer 4.0 开发人员熟悉的 XML 引擎已经得到了很大的增强,并且完全支持 W

  • XML入门的常见问题(三)

    作者:AngelGavin  出处:CSDN 如何加载有外国和特殊字符的文档? 文档可以包含外国字符,例如: foreign characters (úóí?) 例如 磲 的外国字符必须在前面加上 escape 序列.外国字符可以是 UTF-8 编码或用不同编码指定,如下所示: foreign characters (磲) 现在可以正确加载 XML 了. 其他字符是保留在 XML 中的,并且需要以不同的方式处理.下面的 XML: This & that 产生如下错误: 此处不允许有空格. 行

  • php操作xml入门之xml基本介绍及xml标签元素

    本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素.分享给大家供大家参考.具体分析如下: 以xml实例来讲解: 复制代码 代码如下: <?xml version="1.0" encoding="utf-8" standalone="no" ?> <class>  <student>   <name>小乔</name>   <sex>女</sex>

  • Android入门之Activity四种启动模式(standard、singleTop、singleTask、singleInstance)

    当应用运行起来后就会开启一条线程,线程中会运行一个任务栈,当Activity实例创建后就会放入任务栈中.Activity启动模式的设置在AndroidManifest.xml文件中,通过配置Activity的属性android:launchMode=""设置. 一.启动模式介绍 启动模式简单地说就是Activity启动时的策略,在AndroidManifest.xml中的标签的android:launchMode属性设置: 启动模式有4种,分别为standard.singleTop.s

  • XML入门精解之结构与语法

    现在我们暂且使用"记事本"来创建我们的XML文件吧.先看一个XML文件: 例1 〈?xml version="1.0" encoding="gb2312" ?〉 〈参考资料〉 〈书籍〉 〈名称〉XML入门精解〈/名称〉 〈作者〉张三〈/作者〉 〈价格 货币单位="人民币"〉20.00〈/价格〉 〈/书籍〉 〈书籍〉 〈名称〉XML语法〈/名称〉 〈!--此书即将出版--〉 〈作者〉李四〈/作者〉 〈价格 货币单位="

  • php操作xml入门之cdata区段

    本文实例讲述了php操作xml入门之cdata区段.分享给大家供大家参考.具体分析如下: 复制代码 代码如下: <?xml version="1.0" encoding="utf-8" standalone="yes" ?> <class>  <student id="No<001" haha="美女">   <name>小乔</name>

  • php操作xml入门之xml标签的属性分析

    本文实例讲述了php操作xml入门之xml标签的属性.分享给大家供大家参考.具体分析如下: 复制代码 代码如下: <?xml version="1.0" encoding="utf-8" standalone="yes" ?> <class>  <student id="No001" haha="美女">   <name>小乔</name>   &

  • jQuery 操作XML入门

    XMLFile.xml 复制代码 代码如下: <?xml version="1.0" encoding="utf-8" ?> <msglist> <msg name="11"> <id>1</id> <content>content1</content> </msg> <msg name="22"> <id>

随机推荐