python解析xml文件(解析、更新、写入)

python解析xml文件(解析、更新、写入)Overview这篇博客内容将包括对XML文件的解析、追加新元素后写入到XML,以及更新原XML文件中某结点的值。使用的是python的xml.dom.minidom包,详情可见其官方文档:xml.dom.minidom官方文档。全文都将围绕以下的customer.xml进行操作:<?xmlversion=”1.0″encoding=”utf-8″?><!–Thi…

大家好,又见面了,我是你们的朋友全栈君。

Overview

这篇博客内容将包括对XML文件的解析、追加新元素后写入到XML,以及更新原XML文件中某结点的值。使用的是pythonxml.dom.minidom包,详情可见其官方文档:xml.dom.minidom官方文档。全文都将围绕以下的customer.xml进行操作:

<?xml version="1.0" encoding="utf-8" ?>
<!-- This is list of customers -->
<customers>
  <customer ID="C001">
    <name>Acme Inc.</name>
    <phone>12345</phone>
    <comments>
      <![CDATA[Regular customer since 1995]]>
    </comments>
  </customer>
  <customer ID="C002">
    <name>Star Wars Inc.</name>
    <phone>23456</phone>
    <comments>
      <![CDATA[A small but healthy company.]]>
    </comments>
  </customer>
</customers>

CDATA:在XML中,不会被解析器解析的部分数据。

声明:在本文中,结点和节点被视为了同一个概念,你可以在全文的任何地方替换它,我个人感觉区别不是很大,当然,你也可以看做是我的打字输入错误。

1. 解析XML文件

在解析XML时,所有的文本都是储存在文本节点中的,且该文本节点被视为元素结点的子结点,例如:2005,元素节点 ,拥有一个值为 “2005” 的文本节点,“2005” 不是 元素的值,最常用的方法就是getElementsByTagName()方法了,获取到结点后再进一步根据文档结构解析即可。

具体的理论就不过多描述,配合上述XML文件和下面的代码,你将清楚的看到操作方法,下面的代码执行的工作是将所有的结点名称以及结点信息输出一下:

# -*- coding: utf-8 -*-
"""
    @Author  : LiuZhian
    @Time    : 2019/4/24 0024 上午 9:19
    @Comment : 
"""
from xml.dom.minidom import parse
def readXML():
	domTree = parse("./customer.xml")
	# 文档根元素
	rootNode = domTree.documentElement
	print(rootNode.nodeName)

	# 所有顾客
	customers = rootNode.getElementsByTagName("customer")
	print("****所有顾客信息****")
	for customer in customers:
		if customer.hasAttribute("ID"):
			print("ID:", customer.getAttribute("ID"))
			# name 元素
			name = customer.getElementsByTagName("name")[0]
			print(name.nodeName, ":", name.childNodes[0].data)
			# phone 元素
			phone = customer.getElementsByTagName("phone")[0]
			print(phone.nodeName, ":", phone.childNodes[0].data)
			# comments 元素
			comments = customer.getElementsByTagName("comments")[0]
			print(comments.nodeName, ":", comments.childNodes[0].data)

if __name__ == '__main__':
	readXML()

在这里插入图片描述

2. 写入XML文件

在写入时,我觉得可分为两种方式:

  • 新建一个全新的XML文件
  • 在已有XML文件基础上追加一些元素信息

至于以上两种情况,其实创建元素结点的方法类似,你必须要做的都是先创建/得到一个DOM对象,再在DOM基础上创建new一个新的结点。

如果是第一种情况,你可以通过dom=minidom.Document()来创建;如果是第二种情况,直接可以通过解析已有XML文件来得到dom对象,例如dom = parse("./customer.xml")

在具体创建元素/文本结点时,你大致会写出像以下这样的“四部曲”代码:

  • ①创建一个新元素结点createElement()
  • ②创建一个文本节点createTextNode()
  • ③将文本节点挂载元素结点上
  • ④将元素结点挂载到其父元素上。

现在,我需要新建一个customer节点,信息如下:

<customer ID="C003">
    <name>kavin</name>
    <phone>32467</phone>
    <comments>
      <![CDATA[A small but healthy company.]]>
    </comments>
  </customer>

代码如下:

def writeXML():
	domTree = parse("./customer.xml")
	# 文档根元素
	rootNode = domTree.documentElement

	# 新建一个customer节点
	customer_node = domTree.createElement("customer")
	customer_node.setAttribute("ID", "C003")

	# 创建name节点,并设置textValue
	name_node = domTree.createElement("name")
	name_text_value = domTree.createTextNode("kavin")
	name_node.appendChild(name_text_value)  # 把文本节点挂到name_node节点
	customer_node.appendChild(name_node)

	# 创建phone节点,并设置textValue
	phone_node = domTree.createElement("phone")
	phone_text_value = domTree.createTextNode("32467")
	phone_node.appendChild(phone_text_value)  # 把文本节点挂到name_node节点
	customer_node.appendChild(phone_node)

	# 创建comments节点,这里是CDATA
	comments_node = domTree.createElement("comments")
	cdata_text_value = domTree.createCDATASection("A small but healthy company.")
	comments_node.appendChild(cdata_text_value)
	customer_node.appendChild(comments_node)

	rootNode.appendChild(customer_node)

	with open('added_customer.xml', 'w') as f:
		# 缩进 - 换行 - 编码
		domTree.writexml(f, addindent='  ', encoding='utf-8')

if __name__ == '__main__':
	writeXML()

在这里插入图片描述

3. 更新XML文件

在更新XML时,只需先找到对应的元素结点,然后将其下的文本结点或属性取值更新即可,然后保存到文件,具体我就不多说了,代码中我将思路都注释清楚了,如下:

def updateXML():
	domTree = parse("./customer.xml")
	# 文档根元素
	rootNode = domTree.documentElement

	names = rootNode.getElementsByTagName("name")
	for name in names:
		if name.childNodes[0].data == "Acme Inc.":
			# 获取到name节点的父节点
			pn = name.parentNode
			# 父节点的phone节点,其实也就是name的兄弟节点
			# 可能有sibNode方法,我没试过,大家可以google一下
			phone = pn.getElementsByTagName("phone")[0]
			# 更新phone的取值
			phone.childNodes[0].data = 99999

	with open('updated_customer.xml', 'w') as f:
		# 缩进 - 换行 - 编码
		domTree.writexml(f, addindent='  ', encoding='utf-8')

if __name__ == '__main__':
	updateXML()

在这里插入图片描述

如有不对之处,还烦请指教~

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/157875.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • clion 2022.01.13 激活码【最新永久激活】

    (clion 2022.01.13 激活码)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.htmlLGWSVFD4PZ-eyJsaWN…

    2022年4月1日
    211
  • Idea激活码最新教程2017.3.7版本,永久有效激活码,亲测可用,记得收藏

    Idea激活码最新教程2017.3.7版本,永久有效激活码,亲测可用,记得收藏Idea 激活码教程永久有效 2017 3 7 激活码教程 Windows 版永久激活 持续更新 Idea 激活码 2017 3 7 成功激活

    2025年5月24日
    4
  • portraiture 3 mac(最强ps人像美化磨皮滤镜)内附安装教程

    portraiture 3 mac(最强ps人像美化磨皮滤镜)内附安装教程imagenomicportraituremac是一款非常强大的ps人像美化磨皮滤镜,可以更好的辅佐我们的ps进行人像滤镜美化处理。portraituremac激活成功教程版能够智能的对图像中的肤色、毛发以及眉毛等部位进行滤镜抛光处理,细节处理,以减少瑕疵。portraituremac激活成功教程版基本上是人人都能用得上的ps辅助工具,有了它处理人像效果更加显著。小编现为您带来portraiture3滤镜下载,需要的小伙伴快来下载吧!下载地址:https://mac.orsoon.com/Mac/167.

    2022年7月22日
    12
  • OpenCV图像几何变换专题(缩放、翻转、仿射变换及透视)【python-Open_CV系列(五)】

    OpenCV图像几何变换专题(缩放、翻转、仿射变换及透视)【python-Open_CV系列(五)】OpenCV图像几何变换(python为工具)Open_CV系列(五)准备图片1.缩放cv2.resize()方法2.翻转cv2.flip()方法3.仿射变换warpAffine()方法3.1平移3.2旋转3.3倾斜4.透视

    2025年6月3日
    4
  • threadlocal底层实现_数据库底层实现原理

    threadlocal底层实现_数据库底层实现原理ThreadLocal作用:提供线程内的局部变量,不同的线程之间不会相互干扰,这种变量在线程的生命周期内起作用,减少同一个线程内多个函数或组件之间一些公共变量传递的复杂性。package com.mupack;public class App{ private String content; public void setContent(String content) { this.content = content; } public Stri

    2022年8月8日
    4
  • UML详解之四——活动图[通俗易懂]

    UML详解之四——活动图[通俗易懂]活动图(面向活动的)活动图(ActivityDiagrams)在本质上就是流程图,它很好地描述了系统的活动、判定点、先后顺序和分支等,展现从一个活动到另一个活动的控制流。因此它是一种能够描述系统功能流程的工具也是用例图的很好补充。活动图着重表现从一个活动到另一个活动的控制流,是内部处理驱动的流程。图片来自http://blog.csdn.net/lishehe/article/detai

    2022年5月10日
    42

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号