python教程10、模块之json,pickle,xml,pyyaml,shutil,configparser

序列化

Python中用于序列化的两个模块

json 用于【字符串】和【python基本数据类型】间进行转换
pickle 用于【python特有的类型】和【python基本数据类型】间进行转换

Json模块提供了四个功能：dumps、dump、loads、load

pickle模块提供了四个功能：dumps、dump、loads、load

json模块

# json()将字符串形式的列表或字典转换为list或dict类型，json是所有语言相互通信的方式
# 注意外层字符形式一定是''单引号,'{"a":"xiao","b":"xiao"}'列表或字典中的字符串一定要""双引号,否则报错

import json
 
# json.dumps() 将python基本数据类型转化成字符串形式
dic = {'k1':'v1'}
print(dic,type(dic))
result = json.dumps(dic)
print(result,type(result))
 
# json.loads() 将python字符串形式转化成基本数据类型
s = '{"k1":123}'
dic = json.loads(s)
print(dic,type(dic))
 
# json.dump() 先序列化，再写入文件
li = [11,22,33]
json.dump(li,open('db','w'))
 
# json.load() 读取文件反序列化
l = json.load(open('db','r'))
print(l,type(l))

pickle模块　　

pickple只有python才能用,用于复杂类型的序列化,(如果是序列化一个对象,在别的模块中反序列化的时候一定要导入该对象所属的类,否则报错)

import pickle
 
# pickle.dumps() 序列化
li = [11,22,33]
r = pickle.dumps(li)
print(r)
 
# pickle.loads() 反序列化
result = pickle.loads(r)
print(result,type(result))
 
# pickle.dump() 先序列化，再写入文件
l1 = [11,22,33,55]
pickle.dump(l1,open('db','wb'))
 
# pickle.load() 读取文件反序列化
result1 = pickle.load(open('db','rb'))
print(result1,type(result1))

XML模块　　

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，不过，古时候，在json还没诞生的黑暗年代，大家只能选择用xml呀，至今很多传统公司如金融行业的很多系统的接口还主要是xml，XML文件格式如下：

<data>
    <country name="Liechtenstein">
        <rank updated="yes">2</rank>
        <year>2023</year>
        <gdppc>141100</gdppc>
        <neighbor direction="E" name="Austria" />
        <neighbor direction="W" name="Switzerland" />
    </country>
    <country name="Singapore">
        <rank updated="yes">5</rank>
        <year>2026</year>
        <gdppc>59900</gdppc>
        <neighbor direction="N" name="Malaysia" />
    </country>
    <country name="Panama">
        <rank updated="yes">69</rank>
        <year>2026</year>
        <gdppc>13600</gdppc>
        <neighbor direction="W" name="Costa Rica" />
        <neighbor direction="E" name="Colombia" />
    </country>
</data>

1、解析XML两种方法

(1)利用ElementTree.XML将字符串解析成xml对象

from xml.etree import ElementTree as ET
 
# 打开文件，读取XML内容
str_xml = open('xo.xml', 'r').read()
 
# 将字符串解析成xml特殊对象，root代指xml文件的根节点
root = ET.XML(str_xml)

(2)利用ElementTree.parse将文件直接解析成xml对象　　

from xml.etree import ElementTree as ET
 
# 直接解析xml文件
tree = ET.parse("xo.xml")
 
# 获取xml文件的根节点
root = tree.getroot()

2、操作XML　　

XML格式类型是节点嵌套节点，对于每一个节点均有以下功能，以便对当前节点进行操作：

View Code

由于每个节点都具有以上的方法，并且在上一步骤中解析时均得到了root（xml文件的根节点），so 可以利用以上方法进行操作xml文件。

(1)遍历XML文档的所有内容

from xml.etree import ElementTree as ET
 
############ 解析方式一 ############
"""
# 打开文件，读取XML内容
str_xml = open('xo.xml', 'r').read()
 
# 将字符串解析成xml特殊对象，root代指xml文件的根节点
root = ET.XML(str_xml)
"""
############ 解析方式二 ############
 
# 直接解析xml文件
tree = ET.parse("xo.xml")
 
# 获取xml文件的根节点
root = tree.getroot()
 
 
### 操作
 
# 顶层标签
print(root.tag)
 
 
# 遍历XML文档的第二层
for child in root:
    # 第二层节点的标签名称和标签属性
    print(child.tag, child.attrib)
    # 遍历XML文档的第三层
    for i in child:
        # 第二层节点的标签名称和内容
        print(i.tag,i.text)

(2)遍历XML中指定的节点　

from xml.etree import ElementTree as ET
 
############ 解析方式一 ############
"""
# 打开文件，读取XML内容
str_xml = open('xo.xml', 'r').read()
 
# 将字符串解析成xml特殊对象，root代指xml文件的根节点
root = ET.XML(str_xml)
"""
############ 解析方式二 ############
 
# 直接解析xml文件
tree = ET.parse("xo.xml")
 
# 获取xml文件的根节点
root = tree.getroot()
 
 
### 操作
 
# 顶层标签
print(root.tag)
 
 
# 遍历XML中所有的year节点
for node in root.iter('year'):
    # 节点的标签名称和内容
    print(node.tag, node.text)

(3)修改节点内容

由于修改的节点时，均是在内存中进行，其不会影响文件中的内容。所以，如果想要修改，则需要重新将内存中的内容写到文件。

解析字符串方式，修改，保存

from xml.etree import ElementTree as ET
 
############ 解析方式一 ############
 
# 打开文件，读取XML内容
str_xml = open('xo.xml', 'r').read()
 
# 将字符串解析成xml特殊对象，root代指xml文件的根节点
root = ET.XML(str_xml)
 
############ 操作 ############
 
# 顶层标签
print(root.tag)
 
# 循环所有的year节点
for node in root.iter('year'):
    # 将year节点中的内容自增一
    new_year = int(node.text) + 1
    node.text = str(new_year)
 
    # 设置属性
    node.set('name', 'alex')
    node.set('age', '18')
    # 删除属性
    del node.attrib['name']
 
 
############ 保存文件 ############
tree = ET.ElementTree(root)
tree.write("newnew.xml", encoding='utf-8')

解析文件方式，修改，保存

from xml.etree import ElementTree as ET
 
############ 解析方式二 ############
 
# 直接解析xml文件
tree = ET.parse("xo.xml")
 
# 获取xml文件的根节点
root = tree.getroot()
 
############ 操作 ############
 
# 顶层标签
print(root.tag)
 
# 循环所有的year节点
for node in root.iter('year'):
    # 将year节点中的内容自增一
    new_year = int(node.text) + 1
    node.text = str(new_year)
 
    # 设置属性
    node.set('name', 'alex')
    node.set('age', '18')
    # 删除属性
    del node.attrib['name']
 
 
############ 保存文件 ############
tree.write("newnew.xml", encoding='utf-8')
 
解析文件方式，修改，保存

(4)删除节点　　

解析字符串方式打开，删除，保存

from xml.etree import ElementTree as ET
 
############ 解析字符串方式打开 ############
 
# 打开文件，读取XML内容
str_xml = open('xo.xml', 'r').read()
 
# 将字符串解析成xml特殊对象，root代指xml文件的根节点
root = ET.XML(str_xml)
 
############ 操作 ############
 
# 顶层标签
print(root.tag)
 
# 遍历data下的所有country节点
for country in root.findall('country'):
    # 获取每一个country节点下rank节点的内容
    rank = int(country.find('rank').text)
 
    if rank > 50:
        # 删除指定country节点
        root.remove(country)
 
############ 保存文件 ############
tree = ET.ElementTree(root)
tree.write("newnew.xml", encoding='utf-8')

解析文件方式打开，删除，保存

from xml.etree import ElementTree as ET
 
############ 解析文件方式 ############
 
# 直接解析xml文件
tree = ET.parse("xo.xml")
 
# 获取xml文件的根节点
root = tree.getroot()
 
############ 操作 ############
 
# 顶层标签
print(root.tag)
 
# 遍历data下的所有country节点
for country in root.findall('country'):
    # 获取每一个country节点下rank节点的内容
    rank = int(country.find('rank').text)
 
    if rank > 50:
        # 删除指定country节点
        root.remove(country)
 
############ 保存文件 ############
tree.write("newnew.xml", encoding='utf-8')

3、创建XML文档

创建方式（一）

from xml.etree import ElementTree as ET
 
 
# 创建根节点
root = ET.Element("famliy")
 
 
# 创建节点大儿子
son1 = ET.Element('son', {'name': '儿1'})
# 创建小儿子
son2 = ET.Element('son', {"name": '儿2'})
 
# 在大儿子中创建两个孙子
grandson1 = ET.Element('grandson', {'name': '儿11'})
grandson2 = ET.Element('grandson', {'name': '儿12'})
son1.append(grandson1)
son1.append(grandson2)
 
 
# 把儿子添加到根节点中
root.append(son1)
root.append(son1)
 
tree = ET.ElementTree(root)
tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)

创建方式（一）　　

from xml.etree import ElementTree as ET
 
# 创建根节点
root = ET.Element("famliy")
 
 
# 创建大儿子
# son1 = ET.Element('son', {'name': '儿1'})
son1 = root.makeelement('son', {'name': '儿1'})
# 创建小儿子
# son2 = ET.Element('son', {"name": '儿2'})
son2 = root.makeelement('son', {"name": '儿2'})
 
# 在大儿子中创建两个孙子
# grandson1 = ET.Element('grandson', {'name': '儿11'})
grandson1 = son1.makeelement('grandson', {'name': '儿11'})
# grandson2 = ET.Element('grandson', {'name': '儿12'})
grandson2 = son1.makeelement('grandson', {'name': '儿12'})
 
son1.append(grandson1)
son1.append(grandson2)
 
 
# 把儿子添加到根节点中
root.append(son1)
root.append(son1)
 
tree = ET.ElementTree(root)
tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)

创建方式（一）

from xml.etree import ElementTree as ET
 
 
# 创建根节点
root = ET.Element("famliy")
 
 
# 创建节点大儿子
son1 = ET.SubElement(root, "son", attrib={'name': '儿1'})
# 创建小儿子
son2 = ET.SubElement(root, "son", attrib={"name": "儿2"})
 
# 在大儿子中创建一个孙子
grandson1 = ET.SubElement(son1, "age", attrib={'name': '儿11'})
grandson1.text = '孙子'
 
 
et = ET.ElementTree(root)  #生成文档对象
et.write("test.xml", encoding="utf-8", xml_declaration=True, short_empty_elements=False)

由于原生保存的XML时默认无缩进，如果想要设置缩进的话，需要修改保存方式：

from xml.etree import ElementTree as ET
from xml.dom import minidom
 
 
def prettify(elem):
    """将节点转换成字符串，并添加缩进。
    """
    rough_string = ET.tostring(elem, 'utf-8')
    reparsed = minidom.parseString(rough_string)
    return reparsed.toprettyxml(indent="\t")
 
# 创建根节点
root = ET.Element("famliy")
 
 
# 创建大儿子
# son1 = ET.Element('son', {'name': '儿1'})
son1 = root.makeelement('son', {'name': '儿1'})
# 创建小儿子
# son2 = ET.Element('son', {"name": '儿2'})
son2 = root.makeelement('son', {"name": '儿2'})
 
# 在大儿子中创建两个孙子
# grandson1 = ET.Element('grandson', {'name': '儿11'})
grandson1 = son1.makeelement('grandson', {'name': '儿11'})
# grandson2 = ET.Element('grandson', {'name': '儿12'})
grandson2 = son1.makeelement('grandson', {'name': '儿12'})
 
son1.append(grandson1)
son1.append(grandson2)
 
 
# 把儿子添加到根节点中
root.append(son1)
root.append(son1)
 
 
raw_str = prettify(root)
 
f = open("xxxoo.xml",'w',encoding='utf-8')
f.write(raw_str)
f.close()

4、命名空间

详细介绍，猛击这里

from xml.etree import ElementTree as ET
 
ET.register_namespace('com',"http://www.company.com") #some name
 
# build a tree structure
root = ET.Element("{http://www.company.com}STUFF")
body = ET.SubElement(root, "{http://www.company.com}MORE_STUFF", attrib={"{http://www.company.com}hhh": "123"})
body.text = "STUFF EVERYWHERE!"
 
# wrap it in an ElementTree instance, and save as XML
tree = ET.ElementTree(root)
 
tree.write("page.xml",
           xml_declaration=True,
           encoding='utf-8',
           method="xml")

PyYAML模块

Python也可以很容易的处理ymal文档格式，只不过需要安装一个模块，参考文档：http://pyyaml.org/wiki/PyYAMLDocumentation

configparser模块

configparser用于处理特定格式的文件如有键值对[]等，其本质上是利用open来操作文件。

# 注释1
;  注释2
  
[section1] # 节点
k1 = v1    # 值
k2:v2       # 值
  
[section2] # 节点
k1 = v1    # 值

1、获取所有节点　　

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
ret = config.sections()
print(ret)

2、获取指定节点下所有的键值对

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
ret = config.items('section1')
print(ret)

3、获取指定节点下所有的建

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
ret = config.options('section1')
print(ret)

4、获取指定节点下指定key的值

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
  
  
v = config.get('section1', 'k1')
# v = config.getint('section1', 'k1')
# v = config.getfloat('section1', 'k1')
# v = config.getboolean('section1', 'k1')
  
print(v)

5、检查、删除、添加节点

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
  
  
# 检查
has_sec = config.has_section('section1')
print(has_sec)
  
# 添加节点
config.add_section("SEC_1")
config.write(open('xxxooo', 'w'))
  
# 删除节点
config.remove_section("SEC_1")
config.write(open('xxxooo', 'w'))

6、检查、删除、设置指定组内的键值对

import configparser
  
config = configparser.ConfigParser()
config.read('xxxooo', encoding='utf-8')
  
# 检查
has_opt = config.has_option('section1', 'k1')
print(has_opt)
  
# 删除
config.remove_option('section1', 'k1')
config.write(open('xxxooo', 'w'))
  
# 设置
config.set('section1', 'k10', "123")
config.write(open('xxxooo', 'w'))

shutil模块

高级的文件、文件夹、压缩包处理模块，注意当前用户要是对其他文件或目录没有权限会报错

shutil.copyfileobj(fsrc, fdst[, length]) 将文件内容拷贝到另一个文件中

import shutil
 
shutil.copyfileobj(open('/etc/passwd','r'), open('password', 'w'))

shutil.copyfile(src, dst) 拷贝文件　　

import shutil
 
shutil.copyfile('/etc/passwd','password1')

shutil.ignore_patterns(*patterns) 忽略某些文件
shutil.copytree(src, dst, symlinks=False, ignore=None) 递归的去拷贝文件夹

import shutil
 
shutil.copytree('/etc','etc', ignore=shutil.ignore_patterns('*.conf', 'tmp*'))

shutil.rmtree(path[, ignore_errors[, onerror]]) 递归删除文件夹　　

import shutil
 
shutil.rmtree('etc')

shutil.move(src, dst) 它类似mv命令，其实就是重命名。　　

import shutil
  
shutil.move('folder1', 'folder3')

shutil.make_archive(base_name, format,...) 创建压缩包并返回文件路径，例如：zip、tar

创建压缩包并返回文件路径，例如：zip、tar

base_name：压缩包的文件名，也可以是压缩包的路径。只是文件名时，则保存至当前目录，否则保存至指定路径，
如：www =>保存至当前路径
如：/Users/wupeiqi/www =>保存至/Users/wupeiqi/
format：压缩包种类，“zip”, “tar”, “bztar”，“gztar”
root_dir：要压缩的文件夹路径（默认当前目录）
owner：用户，默认当前用户
group：组，默认当前组
logger：用于记录日志，通常是logging.Logger对象

import shutil
 
#将 /home/tomcat/ 下的文件打包放置当前程序目录
ret = shutil.make_archive("test", 'gztar', root_dir='/home/tomcat/')
 
#将 /home/tomcat/ 下的文件打包放置 /home/tomcat/目录
ret = shutil.make_archive("/home/tomcat/www", 'gztar', root_dir='/home/tomcat/')

shutil 对压缩包的处理是调用 ZipFile 和 TarFile 两个模块来进行的，详细：

import zipfile
 
# 压缩
z = zipfile.ZipFile('laxi.zip', 'w')
z.write('a.log')
z.write('data.data')
z.close()
 
# 解压
z = zipfile.ZipFile('laxi.zip', 'r')
z.extractall()
z.close()

TarFile

import tarfile
 
# 压缩
tar = tarfile.open('your.tar','w')
tar.add('/Users/wupeiqi/PycharmProjects/bbs2.log', arcname='bbs2.log')
tar.add('/Users/wupeiqi/PycharmProjects/cmdb.log', arcname='cmdb.log')
tar.close()
 
# 解压
tar = tarfile.open('your.tar','r')
tar.extractall()  # 可设置解压地址
tar.close()

posted on 2018-12-12 17:32 bksts 阅读(528) 评论(0) 收藏举报

刷新页面返回顶部