得到XML文档大小的方法

XML文档从格式到大小都是不是确定的。有的可能只有几行,而有的却有好几兆字节。你也许会怀疑是不是需要了解XML文档的大小。而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了。

从性能角度讲,有两类处理XML文档的方法。批量处理方式需要较短的时间,解析成组的文档。实时方式就是实时的处理文档。批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的。

Scenarios场景
想象一下,你有一个实时工作的系统,比如一个Web服务器。这个系统需要实时的接收客户发来的订单,并需要立即对这个订单进行响应。

这个系统显然不能用批量处理的方式进行。简单的估计一下,假设这是个很简单的订单,只有十个项目,这样所生成的XML文档就比较小,大概每个文档是4KB。这种情况下,使用DOM来解析收到文档。

如果你的订单每小时只有几个,那么系统性能对你来说还不是问题。但是长远考虑,总有一天订单的数量会多到令你意识到系统性能必须提高。

现在你开始考虑提高性能来适应增长的负荷。你的订单文档已经很小了,把它们合并成较大的文档也没有什么实际的意义。从纵向考虑,这时候你可以提高现有系统处理能力;从横向考虑,你可以增加更多的系统将负荷分散开。

再看看另一个完全不同的领域,你现在要处理的是一个大型的数据仓库。和Web服务器完全不同,你现在用FTP来传输平均大小为300MB的XML文档。如果还是使用DOM来解析XML文档,你很快就会遇到大麻烦。相反,如果你使用SAX就会好的多,它可以直接解析流入的XML文档,而不必把它们事先都装入内存。

改变文档尺寸
有时候你会遇到特殊情况需要改变XML文档大小。想象一下,和刚才一样你有一个实时处理XML文档的Web服务器,而此时所有的文档大小都是400MB而不是4KB,你不能使用DOM方式,因为那太占内存了。可是因为这是个实时系统,性能很重要。你可以使用SAX,不过需要时间允许并要有强大的处理器。

在这种情况下,你可以通过改变文档大小来改进系统执行性能。比如你可以将一个400MB的文档分成10个40MB的,或者40个10MB的小文档,这比起处理一个400MB的文档更有效率。这样你就可以使用DOM方式把文件读入内存进行处理,及时响应每个文档的请求了。同时还可以清除掉不相关的文档。

在批量处理方式上也有类似情况。想象一下你在通过DOM的批处理方式处理数千个4KB大小的文档。最好的方式是将一千个文件合并成一个4MB的文件。因为每个文档的载入都需要占用系统时间(不论是DOM还是SAX)。通过将一千个文档合并成一个,你只需要载入一个文档,占用的时间只是原来的千分之一。

(0)

相关推荐

  • 得到XML文档大小的方法

    XML文档从格式到大小都是不是确定的.有的可能只有几行,而有的却有好几兆字节.你也许会怀疑是不是需要了解XML文档的大小.而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了. 从性能角度讲,有两类处理XML文档的方法.批量处理方式需要较短的时间,解析成组的文档.实时方式就是实时的处理文档.批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的. Scenarios场景 想象一下,你有一个实时工作的系统,

  • 如何得到XML文档大小

    XML文档从格式到大小都是不是确定的.有的可能只有几行,而有的却有好几兆字节.你也许会怀疑是不是需要了解XML文档的大小.而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了. 从性能角度讲,有两类处理XML文档的方法.批量处理方式需要较短的时间,解析成组的文档.实时方式就是实时的处理文档.批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的. Scenarios场景想象一下,你有一个实时工作的系统,比

  • dom4j创建和解析xml文档的实现方法

    DOM4J解析 特征: 1.JDOM的一种智能分支,它合并了许多超出基本XML文档表示的功能. 2.它使用接口和抽象基本类方法. 3.具有性能优异.灵活性好.功能强大和极端易用的特点. 4.是一个开放源码的文件 jar包:dom4j-1.6.1.jar 创建 book.xml: package com.example.xml.dom4j; import java.io.FileWriter; import org.dom4j.Document; import org.dom4j.Document

  • Java获取XML节点总结之读取XML文档节点的方法

    dom4j是Java的XML API,用来读写XML文件的.目前有很多场景中使用dom4j来读写xml的. 要使用dom4j开发,需要下载导入dom4j相应的jar文件. 官网下载:http://www.dom4j.org/dom4j-1.6.1/ github下载:http://dom4j.github.io/ 下载解压之后如图所示: 我们只需要把dom4j-1.6.1.jar文件构建到我们开发项目中就可以了. 下面就以Eclipse创建java项目的构建方法为例说明: 声明:本Java项目的

  • 通过php删除xml文档内容的方法

    本文实例讲述了通过php删除xml文档内容的方法.分享给大家供大家参考.具体实现方法如下: 第一种情况:删除一个student节点 复制代码 代码如下: <?php //1.创建一个DOMDocument对象.该对象就表示 xml文件 $xmldoc = new DOMDocument(); //2.加载xml文件(指定要解析哪个xml文件,此时dom树节点就会加载到内存中) $xmldoc->load("class.xml"); //3.删除一条学生student信息记录

  • 通过php添加xml文档内容的方法

    本文实例讲述了通过php添加xml文档内容的方法.分享给大家供大家参考.具体分析如下: 这里讲述的添加xml文档内容,从上一篇<DOM基础及php读取xml内容操作的方法>继续,代码如下: 复制代码 代码如下: <?php //1.创建一个DOMDocument对象.该对象就表示 xml文件 $xmldoc = new DOMDocument(); //2.加载xml文件(指定要解析哪个xml文件,此时dom树节点就会加载到内存中) $xmldoc->load("clas

  • 通过php修改xml文档内容的方法

    本文实例讲述了通过php修改xml文档内容的方法,分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <?php //1.创建一个DOMDocument对象.该对象就表示 xml文件 $xmldoc = new DOMDocument(); //2.加载xml文件(指定要解析哪个xml文件,此时dom树节点就会加载到内存中) $xmldoc->load("class.xml"); //3.更新一条学生student信息记录,更新她的年龄 //(1)找到该学生 $

  • C#操作读取、写入XML文档的实用方法

    本文给大家分享一下C#操作(读取.写入)XML文档的实用方法,这种方法主要是对比较规范的XML文档进行操作,因为它(XML文档)和类对象是严格对应的,否则在反序列或序列化的时候会出现错误.其他的不用多说,直接看示例代码吧: using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Threading.Tasks; using

  • JS实现兼容各浏览器解析XML文档数据的方法

    本文实例讲述了JS实现兼容各浏览器解析XML文档数据的方法.分享给大家供大家参考.具体分析如下: 网站上很多用JS解析XML文档的资料或多或少都有点问题, 以下是自己总结的代码,用来解析XML文档,兼容各个浏览器. parseXMLDOM.js代码: /* * 纯JS解析XML文档(兼容各个浏览器) */ function parseXMLDOM(){ var _browserType = ""; var _xmlFile = ""; var _XmlDom = n

  • C#对XmlHelper帮助类操作Xml文档的通用方法汇总

    前言 该篇文章主要总结的是自己平时工作中使用频率比较高的Xml文档操作的一些常用方法和收集网上写的比较好的一些通用Xml文档操作的方法(主要包括Xml序列化和反序列化,Xml文件读取,Xml文档节点内容增删改的一些通过方法).当然可能还有很多方法会漏了,假如各位同学好的方法可以在文末留言,我会统一收集起来. C#XML基础入门 https://www.jb51.net/article/104113.htm Xml反序列化为对象 #region Xml反序列化为对象 /// <summary>

随机推荐