20,序列化模块 json,pickle,shelve
序列化模块
什么叫序列化?
将原本的字典,列表等内容转换成一个字符串的过程叫做序列化。
序列化的目的?
数据结构 通过序列化 转成 str。
str 通过反序列化 转化成数据结构。
json:
json模块提供了四个功能:dumps,dump,loads,load
loads 和 dumps
import json # dic = {'k1':'v1','k2':'v2','k3':'v3'} # str_dic = json.dumps(dic) ##注意,json转换完的字符串类型的字典中的字符串是由""表示的 # # print([str_dic],type(str_dic))#用列表能看出来是不是字符串。 # dict2 = json.loads(str_dic)##注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示 # print(type(dict2),dict2)#<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'} list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}] list1 = json.dumps(list_dic).strip()#也可以处理嵌套的数据类型 print(type(list1),list1)#<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}] list2 = json.loads(list1) print(list2,type(list2))#[1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}] <class 'list'>
load 和 dump
f = open('json_file','w')#打开一个文件,如果没有该文件自动创建文件 dic = {'k1':'v1','k2':'v2','k3':'v3'} json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串放入文件。 f.close()#关闭文件句柄 f = open('json_file')#打开文件 dic2 = json.load(f)#通过json.load将文件中的内容取出来,直接将文件中的json字符串转换成数据结构 f.close()#关闭文件句柄 print(type(dic2),dic2)
json格式化输出
import json # json格式化输出 data = {'username':['李华','二愣子'],'sex':'male','age':16} json_dic2 = json.dumps(data,sort_keys=True,indent=4,separators=(',',':'),ensure_ascii=False)
json 和 pickle模块
用于序列化的两个模块
json:用于字符串和python数据类型之间的转换。
pickle:用于python特有的类型 和python的数据类型间进行转换。
pickle模块提供了四个功能:dumps,dump (序列化,存) loads(反序列化,读),load(不仅可以序列化字典,列表。。可以把python中任意的数据类型序列化)。
# import pickle # dic = {'k1':'v1','k2':'v2','k3':'v3'} # str_dic = pickle.dumps(dic)#编译成一段bytes类型的数据 # # print(str_dic) # # dic2 = pickle.loads(str_dic)#解开bytes类型的字典。 # print(dic2)
import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二进制内容
dic2 = pickle.loads(str_dic)
print(dic2) #字典
import time
struct_time = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close()
f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year)
pickle
shelve
import shelve f = shelve.open('shelve_file') f['key'] = {'int':10, 'float':9.5, 'string':'Sample data'} #直接对文件句柄操作,就可以存入数据 f.close() import shelve f1 = shelve.open('shelve_file') existing = f1['key'] #取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错 f1.close() print(existing) shelve
这个模块有个限制,它不支持多个应用同一时间往同一个DB进行写操作。所以当我们知道我们的应用如果只进行读操作,我们可以让shelve通过只读方式打开DB
import shelve f = shelve.open('shelve_file', flag='r') existing = f['key'] f.close() print(existing)
由于shelve在默认情况下是不会记录待持久化对象的任何修改的,所以我们在shelve.open()时候需要修改默认参数,否则对象的修改不会保存。
import shelve f1 = shelve.open('shelve_file') print(f1['key']) f1['key']['new_value'] = 'this was not here before' f1.close() f2 = shelve.open('shelve_file', writeback=True) print(f2['key']) f2['key']['new_value'] = 'this was not here before' f2.close()
writeback方式有优点也有缺点。优点是减少了我们出错的概率,并且让对象的持久化对用户更加的透明了;但这种方式并不是所有的情况下都需要,首先,使用writeback以后,shelf在open()的时候会增加额外的内存消耗,并且当DB在close()的时候会将缓存中的每一个对象都写入到DB,这也会带来额外的等待时间。因为shelve没有办法知道缓存中哪些对象修改了,哪些对象没有修改,因此所有的对象都会被写入。