python数据持久存储:pickle模块的基本使用
经常遇到在Python程序运行中得到了一些字符串、列表、字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据。
这个时候Pickle模块就派上用场了,它可以将对象转换为一种可以传输或存储的格式。
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。
一、Pickle对象串行化
Pickle模块将任意一个Python对象转换成一系统字节的这个操作过程叫做串行化对象。
二、Pickle与CPickle对比
前者是完全用Python来实现的模块,这个CPickle是用C来实现的,它的速度要比pickle快好多倍,一般建议如果电脑中只要有CPickle的话都应该使用它。
三、Pickle模块的dump()方法
在Pickle模块中有2个常用的函数方法,一个叫做dump(),另一个叫做load()。
第三部分, pickle.dump()方法:
这个方法的语法是:pickle.dump(对象, 文件,[使用协议])
提示:将要持久化的数据“对象”,保存到“文件”中,使用有3种,索引0为ASCII,1是旧式2进制,2是新式2进制协议,不同之处在于后者更高效一些。 默认的话dump方法使用0做协议。
四、Pickle模块的load方法
load()方法的作用正好与上面的dump()方法相反,上面是序列化数据,这个方法作用是反序列化。
语法:pickle.load(文件)
提示:从“文件”中,读取字符串,将它们反序列化转换为Python的数据对象,可以正常像操作数据类型的这些方法来操作它们。
#使用pickle模块将数据对象保存到文件
import pickle
data1 = {'a': [1, 2.0, 3, 4+6j],
'b': ('string', u'Unicode string'),
'c': None}
selfref_list = [1, 2, 3]
selfref_list.append(selfref_list)
output = open('data.pkl', 'wb')
# Pickle dictionary using protocol 0.
pickle.dump(data1, output)
# Pickle the list using the highest protocol available.
pickle.dump(selfref_list, output, -1)
output.close()
#使用pickle模块从文件中重构python对象
import pprint, pickle
pkl_file = open('data.pkl', 'rb')
data1 = pickle.load(pkl_file)
pprint.pprint(data1)
data2 = pickle.load(pkl_file)
pprint.pprint(data2)
pkl_file.close()