java xml解析框架_JAVA解析xml的五种方式对比

java xml解析框架_JAVA解析xml的五种方式对比本篇文章主要对比Java即系xml的五种方式,这五种方式各有利弊,大家可以看情况采用哪一种。1.DOM解析DOM是html和xml的应用程序接口(API),以层次结构(类似于树型)来组织节点和信息片段,映射XML文档的结构,允许获取和操作文档的任意部分,是W3C的官方标准优点①允许应用程序对数据和结构做出更改。②访问是双向的,可以在任何时候在树中上下导航,获取和操作任意部分的数据。缺点①通常需要…

大家好,又见面了,我是你们的朋友全栈君。

本篇文章主要对比Java即系xml的五种方式,这五种方式各有利弊,大家可以看情况采用哪一种。

1. DOM解析

DOM是html和xml的应用程序接口(API),以层次结构(类似于树型)来组织节点和信息片段,映射XML文档的结构,允许获取和操作文档的任意部分,是W3C的官方标准

优点

①允许应用程序对数据和结构做出更改。

②访问是双向的,可以在任何时候在树中上下导航,获取和操作任意部分的数据。

缺点

①通常需要加载整个XML文档来构造层次结构,消耗资源大。

2. SAX(Simple API for XML)解析

流模型中的”推”模型分析方式。通过事件驱动,每发现一个节点就引发一个事件,事件推给事件处理器,通过回调方法完成解析工作,解析XML文档的逻辑需要应用程序完成

优点

①不需要等待所有数据都被处理,分析就能立即开始。

②只在读取数据时检查数据,不需要保存在内存中。

③可以在某个条件得到满足时停止解析,不必解析整个文档。

④效率和性能较高,能解析大于系统内存的文档。

缺点

①需要应用程序自己负责TAG的处理逻辑(例如维护父/子关系等),文档越复杂程序就越复杂。

②单向导航,无法定位文档层次,很难同时访问同一文档的不同部分数据,不支持XPath。

原理

简单的说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束时通知事件处理函数(回调函数),进行相应处理,直到文档结束

3. JDOM(Java-based Document Object Model)

Java特定的文档对象模型,自身不包含解析器,使用SAX

优点

①使用具体类而不是接口,简化了DOM的API。

②大量使用了Java集合类,方便了Java开发人员。

缺点

①没有较好的灵活性。

②性能较差。

4. DOM4J(Document Object Model for Java)

简单易用,采用Java集合框架,并完全支持DOM、SAX和JAXP

优点

①大量使用了Java集合类,方便Java开发人员,同时提供一些提高性能的替代方法。

②支持XPath。

③有很好的性能。

缺点

①大量使用了接口,API较为复杂。

5. StAX(Streaming API for XML)

流模型中的拉模型分析方式,提供基于指针和基于迭代器两种方式的支持,JDK1.6特性

StAX API的实现是使用了Java Web服务开发(JWSDP)1.6,并结合了Sun Java流式XML分析器(SJSXP)-它位于javax.xml.stream包中。XMLStreamReader接口用于分析一个XML文档,而XMLStreamWriter接口用于生成一个XML文档。XMLEventReader负责使用一个对象事件迭代子分析XML事件-这与XMLStreamReader所使用的光标机制形成对照。

和推式解析相比的优点

①在拉式解析中,事件是由解析应用产生的,因此拉式解析中向客户端提供的是解析规则,而不是解析器。

②同推式解析相比,拉式解析的代码更简单,而且不用那么多库。

③拉式解析客户端能够一次读取多个XML文件。

④拉式解析允许你过滤XML文件和跳过解析事件。

DOM4J的Java-Object2Xml互相转化实例

Object2Xml1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56* DMO4J写入XML

* @param obj 泛型对象

* @param entityPropertys 泛型对象的List集合

* @param Encode XML自定义编码类型(推荐使用GBK)

* @param XMLPathAndName XML文件的路径及文件名

*/

public void writeXmlDocument(T obj, List entityPropertys, String Encode,

String XMLPathAndName) {

long lasting = System.currentTimeMillis();//效率检测

try {

XMLWriter writer = null;// 声明写XML的对象

OutputFormat format = OutputFormat.createPrettyPrint();

format.setEncoding(Encode);// 设置XML文件的编码格式

String filePath = XMLPathAndName;//获得文件地址

File file = new File(filePath);//获得文件

if (file.exists()) {

file.delete();

}

// 新建student.xml文件并新增内容

Document document = DocumentHelper.createDocument();

String rootname = obj.getClass().getSimpleName();//获得类名

Element root = document.addElement(rootname + “s”);//添加根节点

Field[] properties = obj.getClass().getDeclaredFields();//获得实体类的所有属性

for (T t : entityPropertys) { //递归实体

Element secondRoot = root.addElement(rootname); //二级节点

for (int i = 0; i < properties.length; i++) {

//反射get方法

Method meth = t.getClass().getMethod(

“get”

+ properties[i].getName().substring(0, 1)

.toUpperCase()

+ properties[i].getName().substring(1));

//为二级节点添加属性,属性值为对应属性的值

secondRoot.addElement(properties[i].getName()).setText(

meth.invoke(t).toString());

}

}

//生成XML文件

writer = new XMLWriter(new FileWriter(file), format);

writer.write(document);

writer.close();

long lasting2 = System.currentTimeMillis();

System.out.println(“写入XML文件结束,用时”+(lasting2 – lasting)+”ms”);

} catch (Exception e) {

System.out.println(“XML文件写入失败”);

}

}

Xml2Object1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54*

* @param XMLPathAndName XML文件的路径和地址

* @param t 泛型对象

* @return

*/

@SuppressWarnings(“unchecked”)

public List readXML(String XMLPathAndName, T t) {

long lasting = System.currentTimeMillis();//效率检测

List list = new ArrayList();//创建list集合

try {

File f = new File(XMLPathAndName);//读取文件

SAXReader reader = new SAXReader();

Document doc = reader.read(f);//dom4j读取

Element root = doc.getRootElement();//获得根节点

Element foo;//二级节点

Field[] properties = t.getClass().getDeclaredFields();//获得实例的属性

//实例的get方法

Method getmeth;

//实例的set方法

Method setmeth;

for (Iterator i = root.elementIterator(t.getClass().getSimpleName()); i.hasNext();) {//遍历t.getClass().getSimpleName()节点

foo = (Element) i.next();//下一个二级节点

t=(T)t.getClass().newInstance();//获得对象的新的实例

for (int j = 0; j < properties.length; j++) {//遍历所有孙子节点

//实例的set方法

setmeth = t.getClass().getMethod(

“set”

+ properties[j].getName().substring(0, 1)

.toUpperCase()

+ properties[j].getName().substring(1),properties[j].getType());

//properties[j].getType()为set方法入口参数的参数类型(Class类型)

setmeth.invoke(t, foo.elementText(properties[j].getName()));//将对应节点的值存入

}

list.add(t);

}

} catch (Exception e) {

e.printStackTrace();

}

long lasting2 = System.currentTimeMillis();

System.out.println(“读取XML文件结束,用时”+(lasting2 – lasting)+”ms”);

return list;

}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136041.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • CentOS / RHCE 可供使用的yum[通俗易懂]

    CentOS / RHCE 可供使用的yum[通俗易懂]CentOS / RHCE 可供使用的yum

    2022年4月22日
    48
  • clion激活码_在线激活[通俗易懂]

    (clion激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html…

    2022年3月22日
    95
  • zigzag扫描matlab,ZIGZAG扫描的MATLAB实现

    zigzag扫描matlab,ZIGZAG扫描的MATLAB实现转自阿须数码,用MATLAB实现MPEG中的ZIG-ZAG扫描。觉得有点研究价值,实现的方法也很巧妙。下面给一个参照MPEG提供的方法:===functionb=zigzag(a)%这是参照UniversityofCalifornia提供的MPEG源代码的基础上编制的。%Copyright(c)1995TheRegentsoftheUniversityofC…

    2025年8月24日
    3
  • 最强大的疯狂java学习路线图,java学习者必看「建议收藏」

    最强大的疯狂java学习路线图,java学习者必看「建议收藏」双击有图片放大效果

    2022年6月29日
    20
  • lasso回归-回归实操

    lasso回归-回归实操pythonlasso回归算法之回归实操基本概念正则化正则化是指对模型做显式约束,以避免过拟合。本文用到的lasso回归就是L1正则化。(从数学的观点来看,lasso惩罚了系数向量的L1范数,换句话说,就是系数的绝对值之和。)正则化的具体原理就不在这里多叙述了,感兴趣的朋友可以看一下这篇文章:机器学习中正则化项L1和L2的直观理解。算法简介lasso回归在了解lasso回归之前,建议朋友们先对普通最小二乘法和岭回归做一些了解,可以参考这两篇文章:最小二乘法-回归实操,岭回归-回归实操。除了

    2022年5月8日
    59
  • I2C之知(六)–s3c2440用I2C接口访问EEPROM

    I2C之知(六)–s3c2440用I2C接口访问EEPROM在前面阅读理解了I2C的官方协议文档后,就拿s3c2440和EEPROM来验证一下.    本来是想用s3c2440的SDA和SCL管脚复用为GPIO来模拟的,但在没有示波器的情况下搞了一周,怎么都出不来,最后还是放弃了.甚至参考了linux下i2c-algo-bit.c和i2c-gpio.c,依然没调出来.如果有示波器,可能很快就能找到原因,现在完全不知道问题出在哪里.其实想用GPI

    2022年5月31日
    33

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号