python xml文件解析及生成xml文件

#解析一个database的xml文件

"""
<databaselist type="database config">
    <database>
        <host>localhost</host>
        <username>root</username>
        <password>11111</password>
        <datasename>wulaoshi</datasename>
    </database>
</databaselist>
"""

#解析xml文件
domtree=parse('d:\\pylianxi\\data.xml')

#获取根节点
datalist=domtree.documentElement

d={}
#获取标签为database的子节点
database=datalist.getElementsByTagName('database')

#database的子节点轮询，过滤掉textNode节点，取出文本值
for i in database[0].childNodes[1::2]:
    tag=i.tagName
    d[tag]=i.childNodes[0].data #childNodes 获取的是一个列表，通过childNodes[0]获取具体对象

print('database:',d)

2、手动写一个xml文件

#写xml

from xml.dom.minidom import *

#创建一个文档对象
doc=Document()

#创建一个根节点
root=doc.createElement('managers')

#根节点添加属性
root.setAttribute('company','中体彩')
print(root.getAttribute('company'))

#根节点加入到tree
doc.appendChild(root)


#创建二级节点
company=doc.createElement('gloryroad')
name=doc.createElement('name')
name.appendChild(doc.createTextNode('公司名称')) #添加文本节点

#创建一个带着文本节点的子节点
ceo=doc.createElement('ceo')
ceo.appendChild(doc.createTextNode('吴总'))  #<ceo>吴总</ceo>

company.appendChild(name) #name加入到company
company.appendChild(ceo)
root.appendChild(company)#company加入到根节点

print(ceo.tagName)

print(doc.toxml())

#存成xml文件
fp=open('d:\\pylianxi\\test.xml','w',encoding='utf-8')
doc.writexml(fp,indent='',addindent='\t',newl='\n',encoding='utf-8')
fp.close()

3、通过字典数据存成xml文件

from xml.dom.minidom import Document
#在内存中创建一个空的文档
doc = Document() 

#创建一个根节点Managers对象
root = doc.createElement('Managers') 

#设置根节点的属性
root.setAttribute('company', '哈哈科技') 
root.setAttribute('address', '科技软件园') 

#将根节点添加到文档对象中
doc.appendChild(root)
 
managerList = [{'name' : 'joy',  'age' : 27, 'sex' : '女'},
               {'name' : 'tom', 'age' : 30, 'sex' : '男'},
               {'name' : 'ruby', 'age' : 29, 'sex' : '女'}  ]

for i in managerList :
  nodeManager = doc.createElement('Manager')
  for j in i:
    
    nodeName = doc.createElement(j)
    #给叶子节点name设置一个文本节点，用于显示文本内容
    nodeName.appendChild(doc.createTextNode(str(i[j])))
    
    #将各叶子节点添加到父节点Manager中，
    nodeManager.appendChild(nodeName)

  #最后将Manager添加到根节点Managers中
  root.appendChild(nodeManager)

#开始写xml文档
fp = open('d:\\pylianxi\\company11.xml', 'w',encoding='utf-8')
doc.writexml(fp, indent='', addindent='\t', newl='\n', encoding="utf-8")
fp.close()

4、使用etree的方式解析xml文件

#etree xml

from xml.etree import ElementTree as ET

'''
直接解析XML文件并获得根节点

tree = ET.parse(xmlFilePath)

root = tree.getroot()
解析字符串

root = ET.fromstring(fp.read())
'''

tree=ET.ElementTree(file='d:\\pylianxi\\movies.xml')

root=tree.getroot()

#打印根节点的标签及属性字典
print(root.tag)
print(root.attrib)

#获取子节点movie的标签及属性字典
for i in root:
    print (i.tag)
    print ("********", i.attrib)

print ("*"*50)
print (root[0].tag)
print (root[0].text)  #“打印的内容为一个回车”
print (root[0][0].tag) #第一个movie节点的第一个子标签type
print (root[0][0].text)

print ("*"*50)
for i in tree.iter():  #递归遍历所有子元素
    print (i.tag, i.attrib,i.text)

print ("*"*50)
for elem in tree.iterfind('movie/type'):#或者这种方式./movie/type查找movie下一级节点中的所有type标签,类似xpath查找
    print (elem.tag, elem.text)

print ("*"*50)
print(list(tree.iter(tag='stars')))
for elem in tree.iter(tag='stars'):#在整个树中查找标签为stars的元素
    print (elem.tag, elem.text)


print ("*"*50)
for elem in tree.iterfind('*[@title="Ishtar"]'): #或者movie[@title="Ishtar"] 在下一级节点查找属性为title="Ishtar"的元素
    print (elem.tag, elem.attrib)

print ("-"*50)
root = tree.getroot()                #获取第一级movie元素
print ("root:",root[0].tag  )          #打印第一级movie元素的标签，为movie
print ("subnode:",root[0][0].tag)      #打印第一级movie元素下的第一个子元素标签type
print ("subnode:",root[0][1].tag )     #打印第一级movie元素下的第二个子元素标签format
print ("subnode:",root[0][2].tag )     #打印第一级movie元素下的第三个子元素标签year
print ("subnode:",root[0][3].tag )     #打印第一级movie元素下的第四个子元素标签rating
print ("subnode:",root[0][4].tag ) 

del root[0][4] #删除第一级movie元素下的第五个子元素
del root[0][3] #删除第一级movie元素下的第四个子元素
del root[0][2] #删除第一级movie元素下的第三个子元素
del root[0][1] #删除第一级movie元素下的第二个子元素

del root[3] #删除第四个movie元素
del root[2] #删除第三个movie元素

for i in root:
    print(i.tag,i.attrib)
    for j in i:
        print('******',j.tag,j.text)
#tree.write("d:\\movies.xml")  #将变更的xml文件写入到文件中

5、etree的方式生成xml

#etree 生成一个xml

a = ET.Element('elem')            #生成一个节点elem，没有文本节点
aa = ET.SubElement(a, 'type')    #生成一个字节点下的子节点child1
aa.text = "a的type子节点"              #在子节点上添加文本节点
aa2 = ET.SubElement(a, 'name')    #生成一个字节点下的子节点child2
aa2.text='a的name子节点'

b = ET.Element('elem_b')          #生成一个节点elem_b，没有文本节点
b.set('company','科技公司')
bb=ET.SubElement(b,'type')
bb.text='bb的type子节点'
bb2=ET.SubElement(b,'name')
bb2.text='bb的name子节点'

root = ET.Element('root')         #生成一个节点root
root.extend((a, b))               #将a、b两个变量存储的节点elem和elem1添加到root节点下
tree = ET.ElementTree(root)       #生成节点树
root[0].set('foo', 'bar')         #设定第一个子元素的属性foo,值为bar


tree.write("d:\\pylianxi\\test.xml",encoding='utf-8')        #将xml文件内容写入到文本文件中,文件格式并不是很漂亮

posted @ 2019-04-20 16:45 小金儿阅读(5884) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现

公告

昵称：小金儿
园龄： 6年3个月
粉丝： 1
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

小金儿

python xml文件解析及生成xml文件

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

cookie、session、token、json web token的描述

docker+jmeter+prometheus+grafana

java AES 加密、解密

java httpClient 发送请求

java IDEA 热部署相关配置

java springboot整合shiro

java多线程

jenkins相关文档

left join、join的on、where的区别

linux系统相关

mysql binlog相关解析与操作

oracle 数据库

pytest相关文档

python

python3 Hbase相关

python3 hive操作相关

python3 压缩、解压缩zlib

redis 分布式部署安装

TCP time_wait 解读及处理

软件破解操作

三方开源组件

性能测试loadrunner

中间件nginx 操作

阅读排行榜

推荐排行榜

小金儿

python xml文件解析 及生成xml文件

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

cookie、session、token、json web token的描述

docker+jmeter+prometheus+grafana

java AES 加密、解密

java httpClient 发送请求

java IDEA 热部署 相关配置

java springboot整合shiro

java多线程

jenkins相关文档

left join、join的on、where的区别

linux系统相关

mysql binlog相关解析与操作

oracle 数据库

pytest相关文档

python

python3 Hbase相关

python3 hive操作相关

python3 压缩、解压缩zlib

redis 分布式部署安装

TCP time_wait 解读及处理

软件破解操作

三方开源组件

性能测试loadrunner

中间件nginx 操作

阅读排行榜

推荐排行榜

python xml文件解析及生成xml文件

java IDEA 热部署相关配置