Python中Json 和 pickle 详解
序列化和反序列化
eval内置方法可以将一个字符串转成python对象,不过,eval方法是有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式,并返回表达式的值。
我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。
为什么要序列化?
1:持久保存状态
在断电或重启程序之前将程序当前内存中所有的数据都保存下来(保存到文件中),以便于下次程序执行能够从文件中载入之前的数据,然后继续执行,这就是序列化。
2:跨平台数据交互
序列化之后,不仅可以把序列化后的内容写入磁盘,还可以通过网络传输到别的机器上,如果收发的双方约定好实用一种序列化的格式,那么便打破了平台/语言差异化带来的限制,实现了跨平台数据交互。
在python中,有专门处理json格式的模块—— json 和 picle模块
json :序列化
JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。JSON的数据格式其实就是python里面的字典格式,里面可以包含方括号括起来的数组,也就是python里面的列表。
Json 模块提供了四个方法: dumps、dump、loads、load
dumps和dump 序列化方法
序列化成字符串:json.dumps(json_obj)
序列化字符串到文件中:json.dump(json_obj, write_file)
import json
# 将json类型的对象与json类型的字符串相互转换
# {} 与 [] 嵌套形成的数据(python中建议数据的从{}开始)
dic = {
'a': 1,
'b': [1, 2, 3, 4, 5]}
# 序列化: 将python的字典转化为字符串传递给其他语言或保存
json_str = json.dumps(dic)
print(json_str)
with open('1', 'w', encoding='utf-8') as w:
json.dump(dic, w) # 先将dic对象转化为字符串,再写入文件
# w.write(dic)
loads和load 反序列化方法
反序列化成对象:json.loads(json_str)
从文件读流中反序列化成对象:json.load(read_file)
import json
# 反序列化
json_str = '''{"a": 1, "b": ['1', 2, 3, 4, 5]}'''
# json_str = "{'a': 1, 'b': [1, 2, 3, 4, 5]}"
json类型的字符串不认单引号''
json_str = '''{"a": 1, "b": [1, 2, 3, 4, 5]}'''
new_dic = json.loads(json_str)
print(new_dic, type(new_dic))
with open('1', 'r', encoding='utf-8') as r:
res = json.load(r)
print(res)
pickle :序列化
pickle 模块提供了四个方法: dumps、dump、loads、load
dumps和dump 序列化方法
序列化成字符串:json.dumps(json_obj)
序列化字符串到文件中:json.dump(json_obj, write_file)
import pickle
dic = {
'a': 1,
'b': [1, 2, 3, 4, 5]
}
with open('2', 'wb') as w:
pickle.dump(dic, w)
loads和load 反序列化方法
反序列化成对象:json.loads(json_str)
从文件读流中反序列化成对象:json.load(read_file)
import pickle
dic = {
'a': 1,
'b': [1, 2, 3, 4, 5]
}
with open('2', 'rb') as r:
print(pickle.load(r))
json模块和picle模块都有 dumps、dump、loads、load四种方法,而且用法一样。
不一样的是json模块序列化出来的是通用格式,其它编程语言都认识,就是普通的字符串,
而picle模块序列化出来的只有python可以认识,其他编程语言不认识的,表现为乱码