Java使用SAX解析xml的示例

一、SAX解析xml简介

SAX是Simple API for Xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的优点,当然这些优点也仅限于xml的读取操作,SAX是无法对读取的XML元素进行修改的。如果要修改节点元素则需要使用DOC方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作;DOC方式的缺点也比较明显:占内存大、解析速度较慢。

所以仅用于读取xml操作,使用SAX方式是比较好的方式。

二、SAX解析XML实例

创建一个解析的xml文件

<?xml version="1.0" encoding="utf-8"?>
<persons>
  <user>
    <userId>1001</userId>
    <userName>张三</userName>
  </user>
  <user>
    <userId>1002</userId>
    <userName>李四</userName>
  </user>
</persons>

创建一个XMLparseHandler用于自定义xml解析

public class Customhandler extends DefaultHandler2 {

  List<Map> list = new ArrayList<>();
  Map map = null;
  String tag = "";

  @Override
  public void startDocument() throws SAXException {
    System.out.println("开始解析xml");
  }

  @Override
  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    System.out.println("开始解析元素: <"+ qName + ">");
    if(qName == "user"){
      map = new HashMap();
    }
    tag = qName;
  }

  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    String text = new String(ch, start, length).trim();
    if(text != null && !text.isEmpty() && tag!=null&& tag!=""){
      map.put(tag, text);
      if(!map.containsKey(tag)){
      }
      System.out.println("解析到元素值:"+ text);
    }
  }

  @Override
  public void endElement(String uri, String localName, String qName) throws SAXException {
    System.out.println("结束解析元素: <"+ qName + ">");
    if(qName.equals("user")){
      list.add(map);
    }
    tag = "";
  }

  @Override
  public void endDocument() throws SAXException {
    System.out.println("结束解析xml");
  }
}

创建SAX解析对象解析xml

public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
  //创建xml解析工厂
  SAXParserFactory factory = SAXParserFactory.newInstance();
  //创建xml解析对象
  SAXParser parser = factory.newSAXParser();
  File file = new File("test/custom/user.xml");
  InputStream inputStream = new FileInputStream(file);
  Customhandler customhandler = new Customhandler();
  //方式一
  //parser.parse(inputStream, customhandler);

	//方式二
  InputSource source = new InputSource(file.toURI().toURL().toString());
  XMLReader xmlParser = parser.getXMLReader();
  xmlParser.setContentHandler(customhandler);
  xmlParser.parse(source);
  List c = customhandler.list;
  inputStream.close();
}

//打印结果为:
开始解析xml
开始解析元素: <persons>
开始解析元素: <user>
开始解析元素: <userId>
解析到元素值:1001
结束解析元素: <userId>
开始解析元素: <userName>
解析到元素值:张三
结束解析元素: <userName>
结束解析元素: <user>
开始解析元素: <user>
开始解析元素: <userId>
解析到元素值:1002
结束解析元素: <userId>
开始解析元素: <userName>
解析到元素值:李四
结束解析元素: <userName>
结束解析元素: <user>
结束解析元素: <persons>
结束解析xml

三、SAX的实际应用

在tomcat源码中,有一个Digester对象,这个Digester是tomcat启动时,初始化各个容器(service、engine、Connetor)的执行者,而Digester执行容器初始化的依据是解析配置文件server.xml的内容,根据xml的具体配置进行来初始化容器。

下面是Digester的类的一些主要方法:

//org.apache.tomcat.util.digester.Digester#parse(org.xml.sax.InputSource)
public class Digester extends DefaultHandler2 {

  //读取解析xml
  public Object parse(InputSource input) throws IOException, SAXException {
    configure();
    getXMLReader().parse(input);
    return root;
  }

  //对每个xml标签进行解析,并执行于之对应的Rule规则列表
  public void startElement(String namespaceURI, String localName, String qName, Attributes list)
    throws SAXException {
    boolean debug = log.isDebugEnabled();
    // Parse system properties
    list = updateAttributes(list);
    // Save the body text accumulated for our surrounding element
    bodyTexts.push(bodyText);
    bodyText = new StringBuilder();
    // the actual element name is either in localName or qName, depending
    // on whether the parser is namespace aware
    String name = localName;
    if ((name == null) || (name.length() < 1)) {
      name = qName;
    }

    // Compute the current matching rule
    StringBuilder sb = new StringBuilder(match);
    if (match.length() > 0) {
      sb.append('/');
    }
    sb.append(name); //根据每次xml节点的名称拼接成匹配url
    match = sb.toString();

    // Fire "begin" events for all relevant rules(根据namespaceURI匹配获取的Rule规则列表,有顺序规则)
    List<Rule> rules = getRules().match(namespaceURI, match);
    matches.push(rules);
    if ((rules != null) && (rules.size() > 0)) {
      for (Rule value : rules) {
        try {
          Rule rule = value;
          if (debug) {
            log.debug(" Fire begin() for " + rule);
          }
          //依次执行begin方法
          rule.begin(namespaceURI, name, list);
        } catch (Exception e) {
          log.error("Begin event threw exception", e);
          throw createSAXException(e);
        } catch (Error e) {
          log.error("Begin event threw error", e);
          throw e;
        }
      }
    } else {
      if (debug) {
        log.debug(" No rules found matching '" + match + "'.");
      }
    }

  }
}

与之对应的server.xml片段如下:

<Service name="Catalina">

  <Connector port="8081" protocol="HTTP/1.1"
        connectionTimeout="20000"
        redirectPort="8443" />

  <Engine name="Catalina" defaultHost="localhost">

     <Host name="localhost" appBase="webapps"
        unpackWARs="true" autoDeploy="true">
     </Host>
  </Engine>
</Service>

Digester读取到上面这些xml标签后,就会从外向里进行嵌套解析,将这些标签创建为与之对应的java类实例,也就是tomcat的主体容器结构。

以上就是Java使用SAX解析xml的示例的详细内容,更多关于Java使用SAX解析xml的资料请关注我们其它相关文章!

(0)

相关推荐

  • Java下3中XML解析 DOM方式、SAX方式和StAX方式

    先简单说下前三种方式: DOM方式:个人理解类似.net的XmlDocument,解析的时候效率不高,占用内存,不适合大XML的解析:SAX方式:基于事件的解析,当解析到xml的某个部分的时候,会触发特定事件,可以在自定义的解析类中定义当事件触发时要做得事情:个人感觉一种很另类的方式,不知道.Net体系下是否有没有类似的方式?StAX方式:个人理解类似.net的XmlReader方式,效率高,占用内存少,适用大XML的解析:不过SAX方式之前也用过,本文主要介绍JAXB,这里只贴下主要代码: 复

  • Java中使用DOM和SAX解析XML文件的方法示例

    dom4j介绍 dom4j的项目地址:http://sourceforge.net/projects/dom4j/?source=directory dom4j是一个简单的开源库,用于处理XML. XPath和XSLT,它基于Java平台,使用Java的集合框架,全面集成了DOM,SAX和JAXP. dom4j的使用 下载了dom4j项目之后,解压缩,将其jar包(我的当前版本叫做dom4j-1.6.1.jar)加入class path下面. (Properties->Java Build Pa

  • Sax解析xml_动力节点Java学院整理

    JAVA 解析 XML 通常有两种方式,DOM 和 SAX.DOM 虽然是 W3C 的标准,提供了标准的解析方式,但它的解析效率一直不尽如人意,因为使用DOM解析XML时,解析器读入整个文档并构建一个驻留内存的树结构(节点树),然后您的代码才可以使用 DOM 的标准接口来操作这个树结构.但大部分情况下我们只对文档的部分内容感兴趣,根本就不用先解析整个文档,并且从节点树的根节点来索引一些我们需要的数据也是非常耗时的. SAX是一种XML解析的替代方法.相比于文档对象模型DOM,SAX 是读取和操作

  • java解析xml之sax解析xml示例分享

    复制代码 代码如下: package com.test; import java.io.File;import java.io.FileInputStream;import java.util.ArrayList;import java.util.List; import javax.xml.parsers.SAXParser;import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes;import org.x

  • java中使用sax解析xml的解决方法

    在java中,原生解析xml文档的方式有两种,分别是:Dom解析和Sax解析 Dom解析功能强大,可增删改查,操作时会将xml文档以文档对象的方式读取到内存中,因此适用于小文档 Sax解析是从头到尾逐行逐个元素读取内容,修改较为不便,但适用于只读的大文档 本文主要讲解Sax解析,其余放在后面 Sax采用事件驱动的方式解析文档.简单点说,如同在电影院看电影一样,从头到尾看一遍就完了,不能回退(Dom可来来回回读取) 在看电影的过程中,每遇到一个情节,一段泪水,一次擦肩,你都会调动大脑和神经去接收或

  • java操作(DOM、SAX、JDOM、DOM4J)xml方式的四种比较与详解

    1)DOM(JAXP Crimson解析器) DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准.DOM是以层次结构组织的节点或信息片断的集合.这个层次结构允许开发人员在树中寻找特定信息.分析该结构通常需要加载整个文档和构造层次结构,然后才能做任何工作.由于它是基于信息层次的,因而DOM被认为是基于树或基于对象的.DOM以及广义的基于树的处理具有几个优点.首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改.它还可以在任何时候在树中上下导航,而不是像SAX那

  • Java使用SAX解析xml的示例

    一.SAX解析xml简介 SAX是Simple API for Xml的简写,主要功能是用于对xml文档进行解析.由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快.占内存少的优点,当然这些优点也仅限于xml的读取操作,SAX是无法对读取的XML元素进行修改的.如果要修改节点元素则需要使用DOC方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作:DOC方式的缺点也比较明显:占内存大.解析速度较慢. 所以仅用于读取xml

  • Python3基于sax解析xml操作示例

    本文实例讲述了Python3基于sax解析xml操作.分享给大家供大家参考,具体如下: python使用SAX解析xml SAX是一种基于事件驱动的API. 利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器. 解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件; 而事件处理器则负责对事件作出相应,对传递的XML数据进行处理. 1.对大型文件进行处理: 2.只需要文件的部分内容,或者只需从文件中得到特定信息. 3.想建立自己的对象模型的时候. 在python中使用

  • java实现简单解析XML文件功能示例

    本文实例讲述了java实现简单解析XML文件功能.分享给大家供大家参考,具体如下: package demo; import java.io.File; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException;

  • Android中使用sax解析xml文件的方法

    SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备. SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML 语法中的某部分,如果符合就会触发事件.所谓事件,其实就是一些回调(callback)方法,这些方法(事件)定义在ContentHandler接口.下面是一些ContentHandler接口常用的方法: startDocument():当遇到文档的开头的时候,调用

  • 详解android使用SAX解析XML文件

    解析XML的方式有很多种,大家比较熟悉的可能就是DOM解析. DOM(文件对象模型)解析:解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以根据DOM接口来操作这个树结构了. 优点:整个文档读入内存,方便操作:支持修改.删除和重现排列等多种功能. 缺点:将整个文档读入内存中,保留了过多的不需要的节点,浪费内存和空间. 使用场合:一旦读入文档,还需要多次对文档进行操作,并且在硬件资源充足的情况下(内存,CPU). 为了解决DOM解析存在的问题,就出现了SAX解析.其特点为: 优点:不

  • Android编程使用sax解析xml数据的方法详解

    本文实例讲述了Android编程使用sax解析xml数据的方法.分享给大家供大家参考,具体如下: 随着技术的发展,现在的web已经和以前不同了.web已经逐渐像移动的方向倾斜,作为程序员的确应该拓展一下自己的知识层面.学习各方面的知识,今天就接着前几天的弄一下Android的xml解析,这次就使用sax的方式解析xml.下面就一步一步的来做吧. 1. 编写一个简单的xml <?xml version="1.0" encoding="UTF-8"?> &l

  • Python中使用SAX解析xml实例

    SAX是一种基于事件驱动的API.利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器.解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件;而事件处理器则负责对事件作出相应,对传递的XML数据进行处理. 实例: 复制代码 代码如下: import  sys, string from  xml.sax import  handler, make_parser    class  TestHandler(handler.ContentHandler):         

  • java 值Document解析xml详细介绍

    java 值Document解析xml详细介绍 使用jar包:jdom.jar 配置文件格式 global.xml 一.获取输入的值组成的结点 我们将每个结点使用"." 拼接起来, 如结点i ,拼接为abc.def.i, 注意不包含root.解析每个结点的名字. /** * 获取对应结点的名字 * @param name 不包含root结点的拼接,ie: abc.def.i * @return */ private String[] parsePropertyName(String n

  • Java中documentHelper解析xml获取想要的数据

    目录 获取单节点数据 获取数组节点数据 webservice接口的入参和出参都是xml格式的数据,网上有很多方法,下面我将使用documentHelper工具来解析xml格式的数据,获取到自己想要的数据 获取单节点数据 假设我们接口调用成功,出参类似以下格式 <treatyroot> <returncode>0000</returncode> <message>接口调用成功</message> </treatyroot> 这是我们就可

随机推荐