python导入xml文件_python爬虫写入excel

python导入xml文件_python爬虫写入excel最近在使用Testlink时,发现导入的用例是xml格式,且没有合适的工具转成excel格式,xml使用excel打开显示的东西也太多,网上也有相关工具转成csv格式的,结果也不合人意。那求人不如尔己,自己写一个吧需要用到的模块有:xml.dom.minidom(python自带)、xlwt使用版本:python:2.7.5xlwt:1.0.0一、先分析TestlinkXML格式:这是一个有两级…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

最近在使用Testlink时,发现导入的用例是xml格式,且没有合适的工具转成excel格式,xml使用excel打开显示的东西也太多,网上也有相关工具转成csv格式的,结果也不合人意。

那求人不如尔己,自己写一个吧

需要用到的模块有:xml.dom.minidom(python自带)、xlwt

使用版本:

python:2.7.5

xlwt:1.0.0

一、先分析Testlink XML格式:

python导入xml文件_python爬虫写入excel

这是一个有两级testusuit的典型的testlink用例结构,我们只需要取testsuite name,testcase name,preconditions,actions,expectedresults

二、程序如下:

#coding:utf-8

”’

Created on 2015-8-20

@author: Administrator

”’

”’

”’

import xml.etree.cElementTree as ET

import xml.dom.minidom as xx

import os,xlwt,datetime

workbook=xlwt.Workbook(encoding=”utf-8″)

#

booksheet=workbook.add_sheet(u’sheet_1′)

booksheet.col(0).width= 5120

booksheet.col(1).width= 5120

booksheet.col(2).width= 5120

booksheet.col(3).width= 5120

booksheet.col(4).width= 5120

booksheet.col(5).width= 5120

dom=xx.parse(r’D:\\Python27\test.xml’)

root = dom.documentElement

row=1

col=1

borders=xlwt.Borders()

borders.left=1

borders.right=1

borders.top=1

borders.bottom=1

style = xlwt.easyxf(‘align: wrap on,vert centre, horiz center’) #自动换行、水平居中、垂直居中

#设置标题的格式,字体方宋、加粗、背景色:菊黄

#测试项的标题

title=xlwt.easyxf(u’font:name 仿宋,height 240 ,colour_index black, bold on, italic off; align: wrap on, vert centre, horiz center;pattern: pattern solid, fore_colour light_orange;’)

item=’测试项’

Subitem=’测试分项’

CaseTitle=’测试用例标题’

Condition=’预置条件’

actions=’操作步骤’

Result=’预期结果’

booksheet.write(0,0,item,title)

booksheet.write(0,1,Subitem,title)

booksheet.write(0,2,CaseTitle,title)

booksheet.write(0,3,Condition,title)

booksheet.write(0,4,actions,title)

booksheet.write(0,5,Result,title)

#冻结首行

booksheet.panes_frozen=True

booksheet.horz_split_pos= 1

#一级目录

for i in root.childNodes:

testsuite=i.getAttribute(‘name’).strip()

#print testsuite

#print testsuite

”’

写测试项

”’

print “row is :”,row

booksheet.write(row,col,testsuite,style)

#二级目录

for dd in i.childNodes:

print ” %s” % dd.getAttribute(‘name’)

testsuite2=dd.getAttribute(‘name’)

if not dd.getElementsByTagName(‘testcase’):

print “Testcase is %s” % testsuite2

row=row+1

booksheet.write(row,2,testsuite2,style) #写测试分项

row=row+1

booksheet.write(row,1,testsuite2,style)

itemlist=dd.getElementsByTagName(‘testcase’)

for subb in itemlist:

#print ” %s” % subb.getAttribute(‘name’)

testcase=subb.getAttribute(‘name’)

row=row+1

booksheet.write(row,2,testcase,style)

ilist=subb.getElementsByTagName(‘preconditions’)

for ii in ilist:

preconditions=ii.firstChild.data.replace(“
“,” “)

col=col+1

booksheet.write(row,3,preconditions,style)

steplist=subb.getElementsByTagName(‘actions’)

#print steplist

for step in steplist:

actions=step.firstChild.data.replace(“
“,” “)

col=col+1

booksheet.write(row,4,actions,style)

#print “测试步骤:”,steplist[0].firstChild.data.replace(“
“,” “)

expectlist=subb.getElementsByTagName(‘expectedresults’)

for expect in expectlist:

result=expect.childNodes[0].nodeValue.replace(“
“,”” )

booksheet.write(row,5,result,style)

row=row+1

workbook.save(‘demo.xls’)

写入excel的效果如下:

python导入xml文件_python爬虫写入excel

我们再来看个实例:

需要下载一个module:xlwt,如下是source code

import xml.dom.minidom

import xlwt

import sys

col = 0

row = 0

def handle_xml_report(xml_report, excel):

problems = xml_report.getElementsByTagName(“problem”)

handle_problems(problems, excel)

def handle_problems(problems, excel):

for problem in problems:

handle_problem(problem, excel)

def handle_problem(problem, excel):

global row

global col

code = problem.getElementsByTagName(“code”)

file = problem.getElementsByTagName(“file”)

line = problem.getElementsByTagName(“line”)

message = problem.getElementsByTagName(“message”)

for node in code:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in file:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in line:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in message:

excel.write(row, col, node.firstChild.data)

col = col + 1

row = row+1

col = 0

if __name__ == ‘__main__’:

if(len(sys.argv) <= 1):

print (“usage: xml2xls src_file [dst_file]”)

exit(0)

#the 1st argument is XML report ; the 2nd is XLS report

if(len(sys.argv) == 2):

xls_report = sys.argv[1][:-3] + ‘xls’

#if there are more than 2 arguments, only the 1st & 2nd make sense

else:

xls_report = sys.argv[2]

xmldoc = xml.dom.minidom.parse(sys.argv[1])

wb = xlwt.Workbook()

ws = wb.add_sheet(‘MOLint’)

ws.write(row, col, ‘Error Code’)

col = col + 1

ws.write(row, col, ‘file’)

col = col + 1

ws.write(row, col, ‘line’)

col = col + 1

ws.write(row, col, ‘Description’)

row = row + 1

col = 0

handle_xml_report(xmldoc, ws)

wb.save(xls_report)

本文标题: Python实现将xml导入至excel

本文地址: http://www.cppcns.com/jiaoben/python/135334.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/171950.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 谷歌地图 离线地图_地图谷歌高清手机版

    谷歌地图 离线地图_地图谷歌高清手机版离线地图解决方案,除了买地图数据,使用专业的ArcGIS来做外,也可以使用GMap.Net来做。关于GMap的开发教程,可以看我以前的文章:基于GMap.Net的地图解决方案使用了GMap一年了,也有了一些积累,开发了一个可以下载ArcGIS、百度、谷歌、高德、腾讯SOSO、天地图、Here等地图的地图下载器。百度和google地图加载显示如下:百度普通地图:百度混合地图:…

    2022年9月20日
    4
  • 彻底解决Intellij IDEA中文乱码问题(亲测成功)「建议收藏」

    关于JAVA IDE开发工具,Eclipse系列和Intelli IDEA是大部分公司的主要选择,从开发者的选择角度,Intellij IDEA似乎比Eclipse系列更受欢迎一些。当我们使用Intellij IDEA开发时,我们发现出现中文乱码问题,造成中…

    2022年3月13日
    2.9K
  • 算法(一)时间复杂度「建议收藏」

    算法(一)时间复杂度「建议收藏」算法很重要,但是由于做移动开发并不经常用到,所以很多同学早就将算法打了个大礼包送还给了老师了,况且很多同学并没有学习过算法。这个系列就让对算法头疼的同学能快速的掌握基本的算法。过年放假阶段玩了会游戏NBA2K17的生涯模式,没有比赛的日子也都是训练,而且这些训练都是自发的,没有人逼你,从早上练到晚上,属性也不涨,但是如果日积月累,不训练和训练的人的属性值就会产生较大差距。这个突然让我意识到

    2022年5月15日
    41
  • 如何用matlab编写分段函数_请教各位怎样用matlab定义一个分段函数MATLAB分段函数…[通俗易懂]

    如何用matlab编写分段函数_请教各位怎样用matlab定义一个分段函数MATLAB分段函数…[通俗易懂]请教各位怎样用matlab定义一个分段函数MATLAB分段函数www.zhiqu.org时间:2020-12-27步骤如下1、打开MATLAB软件,如图所示。2、建立一个脚本文件,具体方法如图所示。3、定义变量。4、建立循环,求解分段函数。5、采用以下指令画图。6、画出的图片如图所示。扩展资料20世纪70年代,美国新墨西哥大学计算机科学系主任CleveMoler为了减轻学生编程的…

    2022年5月26日
    49
  • namecheap 域名服务商,每次登录都需要验证码

    namecheap 域名服务商,每次登录都需要验证码

    2022年2月18日
    57
  • RSA登录加密_rsa私钥加密公钥解密

    RSA登录加密_rsa私钥加密公钥解密随手记2本文章仅作学习参考使用,不做其他使用。​​​​​​网站:aHR0cHM6Ly9iZWlqaW5nLnR1aXR1aTk5LmNvbS9kZW5nbHUuaHRtbA==输入登录密码“123456”,分析抓包数据如下:返回了一个document类型的包,表单提交的方式,无法使用跟栈的方式定位加密方法,所以这里我使用搜索url的方式定位加密位置,如下:然后在全局搜索关键字“l_submit”,直接跟进加密方法里去,下断点开始调试得到了密码的明文数据,并且在下面也发…

    2025年8月26日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号