dom4j解析xml字符串

dom4j解析xml字符串与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。先来看看dom4j中对应XML的DOM树建立的继承关系针对于XML标准定义,对应于图2-1列出的内容,do

大家好,又见面了,我是你们的朋友全栈君。

         与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、
功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。
dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。

先来看看dom4j中对应XML的DOM树建立的继承关系

dom4j解析xml字符串

针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:

dom4j解析xml字符串

同时,dom4j的NodeType枚举实现了XML规范中定义的node类型。
如此可以在遍历xml文档的时候通过常量来判断节点类型了

常用API
class org.dom4j.io.SAXReader
   read  提供多种读取xml文件的方式,返回一个Domcument对象
interface org.dom4j.Document
   iterator  使用此法获取node
   getRootElement  获取根节点
interface org.dom4j.Node
   getName  获取node名字,例如获取根节点名称为bookstore
   getNodeType  获取node类型常量值,例如获取到bookstore类型为1——Element
   getNodeTypeName  获取node类型名称,例如获取到的bookstore类型名称为Element
interface org.dom4j.Element
   attributes  返回该元素的属性列表
   attributeValue  根据传入的属性名获取属性值
   elementIterator  返回包含子元素的迭代器
   elements  返回包含子元素的列表
interface org.dom4j.Attribute
   getName  获取属性名
   getValue  获取属性值
interface org.dom4j.Text
   getText  获取Text节点值 
interface org.dom4j.CDATA
   getText  获取CDATA Section值
interface org.dom4j.Comment
   getText  获取注释

DEMO一:

//先加入dom4j.jar包 
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;

/**   
* @Title: TestDom4j.java
* @Package 
* @Description: 解析xml字符串
* @author 无处不在
* @date 2012-11-20 下午05:14:05
* @version V1.0   
*/
public class TestDom4j {

    public void readStringXml(String xml) {
        Document doc = null;
        try {

            // 读取并解析XML文档
            // SAXReader就是一个管道,用一个流的方式,把xml文件读出来
            // 
            // SAXReader reader = new SAXReader(); //User.hbm.xml表示你要解析的xml文档
            // Document document = reader.read(new File("User.hbm.xml"));
            // 下面的是通过解析xml字符串的
            doc = DocumentHelper.parseText(xml); // 将字符串转为XML

            Element rootElt = doc.getRootElement(); // 获取根节点
            System.out.println("根节点:" + rootElt.getName()); // 拿到根节点的名称

            Iterator iter = rootElt.elementIterator("head"); // 获取根节点下的子节点head

            // 遍历head节点
            while (iter.hasNext()) {

                Element recordEle = (Element) iter.next();
                String title = recordEle.elementTextTrim("title"); // 拿到head节点下的子节点title值
                System.out.println("title:" + title);

                Iterator iters = recordEle.elementIterator("script"); // 获取子节点head下的子节点script

                // 遍历Header节点下的Response节点
                while (iters.hasNext()) {

                    Element itemEle = (Element) iters.next();

                    String username = itemEle.elementTextTrim("username"); // 拿到head下的子节点script下的字节点username的值
                    String password = itemEle.elementTextTrim("password");

                    System.out.println("username:" + username);
                    System.out.println("password:" + password);
                }
            }
            Iterator iterss = rootElt.elementIterator("body"); ///获取根节点下的子节点body
            // 遍历body节点
            while (iterss.hasNext()) {

                Element recordEless = (Element) iterss.next();
                String result = recordEless.elementTextTrim("result"); // 拿到body节点下的子节点result值
                System.out.println("result:" + result);

                Iterator itersElIterator = recordEless.elementIterator("form"); // 获取子节点body下的子节点form
                // 遍历Header节点下的Response节点
                while (itersElIterator.hasNext()) {

                    Element itemEle = (Element) itersElIterator.next();

                    String banlce = itemEle.elementTextTrim("banlce"); // 拿到body下的子节点form下的字节点banlce的值
                    String subID = itemEle.elementTextTrim("subID");

                    System.out.println("banlce:" + banlce);
                    System.out.println("subID:" + subID);
                }
            }
        } catch (DocumentException e) {
            e.printStackTrace();

        } catch (Exception e) {
            e.printStackTrace();

        }
    }

    /**
     * @description 将xml字符串转换成map
     * @param xml
     * @return Map
     */
    public static Map readStringXmlOut(String xml) {
        Map map = new HashMap();
        Document doc = null;
        try {
            // 将字符串转为XML
            doc = DocumentHelper.parseText(xml); 
            // 获取根节点
            Element rootElt = doc.getRootElement(); 
            // 拿到根节点的名称
            System.out.println("根节点:" + rootElt.getName()); 

            // 获取根节点下的子节点head
            Iterator iter = rootElt.elementIterator("head"); 
            // 遍历head节点
            while (iter.hasNext()) {

                Element recordEle = (Element) iter.next();
                // 拿到head节点下的子节点title值
                String title = recordEle.elementTextTrim("title"); 
                System.out.println("title:" + title);
                map.put("title", title);
                // 获取子节点head下的子节点script
                Iterator iters = recordEle.elementIterator("script"); 
                // 遍历Header节点下的Response节点
                while (iters.hasNext()) {
                    Element itemEle = (Element) iters.next();
                    // 拿到head下的子节点script下的字节点username的值
                    String username = itemEle.elementTextTrim("username"); 
                    String password = itemEle.elementTextTrim("password");

                    System.out.println("username:" + username);
                    System.out.println("password:" + password);
                    map.put("username", username);
                    map.put("password", password);
                }
            }

            //获取根节点下的子节点body
            Iterator iterss = rootElt.elementIterator("body"); 
            // 遍历body节点
            while (iterss.hasNext()) {
                Element recordEless = (Element) iterss.next();
                // 拿到body节点下的子节点result值
                String result = recordEless.elementTextTrim("result"); 
                System.out.println("result:" + result);
                // 获取子节点body下的子节点form
                Iterator itersElIterator = recordEless.elementIterator("form"); 
                // 遍历Header节点下的Response节点
                while (itersElIterator.hasNext()) {
                    Element itemEle = (Element) itersElIterator.next();
                    // 拿到body下的子节点form下的字节点banlce的值
                    String banlce = itemEle.elementTextTrim("banlce"); 
                    String subID = itemEle.elementTextTrim("subID");

                    System.out.println("banlce:" + banlce);
                    System.out.println("subID:" + subID);
                    map.put("result", result);
                    map.put("banlce", banlce);
                    map.put("subID", subID);
                }
            }
        } catch (DocumentException e) {
            e.printStackTrace();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return map;
    }

    public static void main(String[] args) {

        // 下面是需要解析的xml字符串例子
        String xmlString = "<html>" + "<head>" + "<title>dom4j解析一个例子</title>"
                + "<script>" + "<username>yangrong</username>"
                + "<password>123456</password>" + "</script>" + "</head>"
                + "<body>" + "<result>0</result>" + "<form>"
                + "<banlce>1000</banlce>" + "<subID>36242519880716</subID>"
                + "</form>" + "</body>" + "</html>";

        /*
         * Test2 test = new Test2(); test.readStringXml(xmlString);
         */
        Map map = readStringXmlOut(xmlString);
        Iterator iters = map.keySet().iterator();
        while (iters.hasNext()) {
            String key = iters.next().toString(); // 拿到键
            String val = map.get(key).toString(); // 拿到值
            System.out.println(key + "=" + val);
        }
    }

}

DEMO二:

/**
 * 解析包含有DB连接信息的XML文件
 * 格式必须符合如下规范:
 * 1. 最多三级,每级的node名称自定义;
 * 2. 二级节点支持节点属性,属性将被视作子节点;
 * 3. CDATA必须包含在节点中,不能单独出现。
 *
 * 示例1——三级显示:
 * <db-connections>
 *         <connection>
 *            <name>DBTest</name>
 *            <jndi></jndi> 
 *            <url>
 *                <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]>
 *             </url>
 *            <driver>org.gjt.mm.mysql.Driver</driver>
 *             <user>test</user>
 *            <password>test2012</password>
 *            <max-active>10</max-active>
 *            <max-idle>10</max-idle>
 *            <min-idle>2</min-idle>
 *            <max-wait>10</max-wait>
 *            <validation-query>SELECT 1+1</validation-query>
 *         </connection>
 * </db-connections>
 *
 * 示例2——节点属性:
 * <bookstore>
 *         <book category="cooking">
 *            <title lang="en">Everyday Italian</title>
 *            <author>Giada De Laurentiis</author>
 *            <year>2005</year>
 *            <price>30.00</price>
 *         </book>
 *
 *         <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/>
 * </bookstore>
 *
 * @param configFile
 * @return
 * @throws Exception
 */
public static List<Map<String, String>> parseDBXML(String configFile) throws Exception {
    List<Map<String, String>> dbConnections = new ArrayList<Map<String, String>>();
    InputStream is = Parser.class.getResourceAsStream(configFile);
    SAXReader saxReader = new SAXReader();
    Document document = saxReader.read(is);
    Element connections = document.getRootElement();

    Iterator<Element> rootIter = connections.elementIterator();
    while (rootIter.hasNext()) {
        Element connection = rootIter.next();
        Iterator<Element> childIter = connection.elementIterator();
        Map<String, String> connectionInfo = new HashMap<String, String>();
        List<Attribute> attributes = connection.attributes();
        for (int i = 0; i < attributes.size(); ++i) { // 添加节点属性
            connectionInfo.put(attributes.get(i).getName(), attributes.get(i).getValue());
        }
        while (childIter.hasNext()) { // 添加子节点
            Element attr = childIter.next();
            connectionInfo.put(attr.getName().trim(), attr.getText().trim());
        }
        dbConnections.add(connectionInfo);
    }

    return dbConnections;
}

       一直都想整理下dom4j,直到今天在网上看到一篇比较好的日志,就转了下了,在此感谢大神。同时也希望通过我的转载能让更多的人学习到大神的精髓,向大神致敬!

转载地址:http://www.cnblogs.com/macula/archive/2011/07/27/2118003.html

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152043.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 如何设计一个通用的权限管理系统

    点击上方“全栈程序员社区”,星标公众号 重磅干货,第一时间送达 作者:PioneerYi juejin.im/post/6850037267554287629 一个系统,如果没有安…

    2021年6月27日
    69
  • expect用法介绍

    expect用法介绍一、概念Expect是一个用来实现自动交互功能的软件套件。执行shell脚本,需要从终端得到输入时(如sshroot@192.168.1.2),Expect可以根据提示,模拟标准输入来实现交互脚本执行,使其以非交互的方式执行可以把shell和expect理解为两种不同的脚本语言,expect有独自的语法、变量二、ssh远程主机的方式2.1.简单方式,直接使用expect命令#!/bin/bash#登陆远程主机并查看主机名IP=”192.168.1.2″USERNAME=”root”P

    2025年8月23日
    1
  • DUMPBIN命令使用详解

    DUMPBIN命令使用详解DUMPBIN命令使用详解2018-08-07有可能你会遇到“’dumpbin’不是内部或外部命令,也不是可运行的程序或批处理文件。”的提示,怎么办呢?1.找到VCVARS32.bat,比如在我的机器上其路径为:C:\ProgramFiles\MicrosoftVisualStudio8\VC\bin\vcvars32.bat2.将VCVARS32.bat拖放…

    2022年6月19日
    40
  • 函数指针,指针函数,返回值为指针的函数「建议收藏」

    函数指针,指针函数,返回值为指针的函数「建议收藏」在学习C语言时,一个比较容易混淆的概念就是函数指针、指针函数、返回值为指针的函数。本文将对这三个概念进行区分。指针函数就是返回值为指针的函数,两个本质上是同一事物,只是叫法不同。函数指针就是一个指向函数的指针,本质上是一个指针,只是这个指针指向的对象是函数,而不是一般意义上的存储对象。

    2022年6月22日
    33
  • (2021 最新版)IntelliJ IDEA 下载安装及配置教程

    (2021 最新版)IntelliJ IDEA 下载安装及配置教程前言因为自己电脑最近实在是太卡了,也一直提示更新,索性就直接重装了个系统。因为需要重装下IDEA,而现在新版本的IDEA和之前的版本还是有很大变化的,所以在这里写一篇博客做个记录,方便自己后续配置,也顺便分享给大家。准备工作既然要安装IDEA,那么首先需要前往JetBrains的官网下载最新版的IDEA,下载地址如下:https://www.jetbrains.com/idea/download/这里最新的版本是2021.1.2,而因为我有旗舰版的账号,所以这里就以旗舰版安装

    2022年5月20日
    918
  • linux中777是什么权限_centos切换到root用户

    linux中777是什么权限_centos切换到root用户基本上就是全部开放读写执行操作权限一个文件有三个权限,分别是读、写和执行,它们对应的数分别是4、2和1。如果某个用户只有读权限没有写和执行权限当然就是4,如果三个如果有读和执行权限就是5(4+1)所以有全部权限就是7了。而一个文件或文件夹面对的用户分三类:所属用户、所属用户的组其他用户以及组外用户。所以777三个数字就是对应这三个用户对象全部都有读、写、执行权限。如果是所属用户有全部权限,组员有读…

    2022年10月9日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号