内置json&pickle&shelve&xml
序列化:把对象(变量)从内存中变成可存储可传输的过程称之为序列化,Python中叫做pickling,其他语言中也被称之为serialization,marshalling,flattening等等
序列化之后就可以将内容存储到硬盘或通过网络传输到别的机器上
反序列化:将序列化的对象从硬盘中读取到内存中,叫做unpickling
如果想在不同语言之间传递信息,必须将对象序列化成标准格式
json是一种通用标准格式,表现为一个字符串,可以被其他语言读取
json是JavaScript语言的对象,json与Python的数据类型对比:
#json模块:任何语言都通用,json它是JavaScript中一个对象 import json dic = {"name":"sjy"} date = json.dumps(dic) #这个得到的是json字符串,将传入的数据类型都变成json字符串 #json只认双引号,它会把数据类型的里面的所有单引号变成双引号,实质是变成json中的字符串格式 f = open("new","w") f.write(date) #将经过json方法处理过的json字符串写进文件中 f.close() with open("new","r") as f_r: n = json.loads(f_r.read()) #用json方法读取这个文件,这样得到的内容时json字符串内的数据类型 print(n) #相当于eval()提取字符串中的数据类型,但json是通用的,经过json处理可以直接在其他语言上用 print(type(n)) # json.dump(dic,f) #这个等同于date=json.dumps(dic);f.write(date)这两步 # json.load(f_r) #等同于json.loads(f_r.read()) #这两种用于文件操作,建议用 dumps,loads 这两个可使用范围广些 """ json 会把给的数据类型里面的单引号变成双引号,并将其变成json字符串,实质是变成json中的字符串格式 例如:原内容 ------> 转换成字符串 ---->显示给用户的内容 dic = {'name':'sjy'} ------> '{"name":"sjy"}'---->{"name":"sjy"} i = 7 ------> '7' ---->7 s = 'hello' ------> '"hello"' ---->"hello" l = [1,2,3] ------> "[1,2,3]" ---->[1,2,3] json是通用的,对一些内容进行json处理后,可以以json字符串的形式存放在硬盘中 而调用这些内容时,可以用json的方法直接调用json字符串里的数据类型,类似eval() 但相比较而言json可以跨语言使用,其他语言可以直接拿取使用 json中dumps方式是将内容序列化,loads是反序列化 """
#pickle模块,使用方法和json一样,功能也类似
#pickle是Python特有的序列化操作,只适用于Python,且不同版本之间可能还存在不兼容的情况
import pickle dic = {'name':'sjy'} j = pickle.dumps(dic) #注意和json的区别,pickle是将数据类型转换成字节 with open("new_p","wb") as f: #因为是pickle是将内容转换成字节,要wb方式写入 f.write(j) with open("new_p","rb") as f_r: n = pickle.loads(f_r.read()) print(n)
#shelve模块 import shelve f = shelve.open(r"new_s") #用shelve方法建立文件,再将数据内容写进去,会生成3个文件 f["shout"] = {"name":"sjy"} f.close() f.get("shout") #用这个模块可以直接使用写进去的数据类型的方法,这个模块是在内部已做好序列化和反序列化的操作
xml:和json一样,也是可以实现不同语言之间的互通
xml格式是通过<>节点来区分数据结构的,如下
<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name="Singapore"> <rank updated="yes">5</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N"/> </country> <country name="Panama"> <rank updated="yes">69</rank> <year>2011</year> <gdppc>13600</gdppc> <neighbor name="Costa Rica" direction="W"/> <neighbor name="Colombia" direction="E"/> </country> </data> xml数据
#xml模块:和json的区别,xml使用的是标签语言 import xml.etree.ElementTree as ET #导入这个模块,并将这个模块赋值给某个变量,模块名太长,赋值给变量,方便书写 tree = ET.parse("xml_lesson") #利用parse方法将xml文件解析出来,并将内容赋值给一个变量,此时这个变量就是一个对象 root = tree.getroot() #获取这个对象的根 print(root.tag) #.tag获取这个根标签的名字 for i in root: #循环遍历这个根,获取根下的内容 print(i) #这里打印出来的是内存地址,因为得到的是一个个对象 print(i.tag) #通过.tag获取每个对象的根标签名字 print(i.attrib) #通过.attrib方法获取每个标签里的属性,放在一个字典中 for j in i: #遍历这个根 print(j.tag) #和上面一样,获取名字 print(j.attrib) #获取标签里的属性 print(j.text) #通过.text获取每个标签里的具体文本内容 for node in root.iter("year"): #通过.iter('标签名")获取某一层级的所有这个名字标签 print(node.tag,node.text) new_year = int(node.text) + 1 #对这个标签里的文本内容进行修改 node.text = str(new_year) #将修改的内容再赋值给这个标签 node.set("date","no") #用.set对这个标签的属性进行修改 tree.write("new_xml.xml") #将修改的内容重新写进xml文件 for count in root.findall("country"): #.findall("标签名")找出所有的这个名字的标签 ran = int(count.find("rank").text) if ran > 50: root.remove(count) #移除 tree.write("out_xml.xml") """ 将一个xml文件通过parse方法解析后,再循环遍历每个层级, 并用.tag方法获取每个层级根标签的名字,注意是根标签,不是所有,不包含根里嵌套的标签 .attrib方法获取每个标签的属性, .text方法获取标签里具体的文本内容 若想只获取其中一个标签,用.iter("标签名")方法得到这个层级下的所有(含嵌套里的)这个名字的标签 若想修改某个标签里的文本内容:先.next获取内容,再修改获取的内容后传回给.next 修改标签的属性:.set("属性名","属性内容"),最后将修改的内容write写进xml """
#创建一个xml
import xml.etree.ElementTree as ET new_xml_lesson = ET.Element("namelist") #使用模块方法 .Element("标签名") 创建一个根标签namelist并赋值给一个变量 name = ET.SubElement(new_xml_lesson,"name",attrib = {"enrolled":"no"}) #使用模块方法 .SubElement("上一级标签","当前级标签","当天级标签属性") 创建下一级的标签并赋值给一个变量 age = ET.SubElement(name,"age",attrib={"checked":"no"},) sex = ET.SubElement(age,"sex") sex.text = "25" #对某个标签添加文本内容 et = ET.ElementTree(new_xml_lesson) #使用模块方法.ElementTree 将整个根内容生成文档对象 et.write("test.xml",encoding="utf8",xml_declaration=True) #把它写进一个xml文件中 # ET.dump(new_xml_lesson) #打印生成的格式