python3-常用模块之序列化

序列化 : 把其他的数据类型转换成字符串或者bytes
序列 : 列表、元组、字符串、bytes

为什么要把其他数据类型转换成字符串?
能够在网络上传输的只能是bytes,能够存储在文件里的只有bytes和str

网络传输过程
字典 -> 字符串 -通过网络去传输-> 字符串 -> 字典

序列化 字典 -> 字符串，可以直接使用str()
str_dic = str([1,2,3])
print(str_dic,type(str_dic))
输出：[1, 2, 3] <class 'str'>

反序列化 字符串 -> 字典使用eval()（从文件中读出来的或者网络上接收来）
str_dic = str([1,2,3])
res = eval(str_dic)
print(res,type(res))
输出：[1, 2, 3] <class 'list'>
注意：eval()函数十分强大，但eval官方demo解释为：将字符串str当成有效的表达式来求值并返回计算结果。
强大的函数有代价。安全性是其最大的缺点。
比如"删除文件"类似的破坏性语句，那么后果实在不堪设设想。
val('import os;os.remove('c:')')
所以，不推荐用eval方法来进行反序列化操作(将str转换成python中的数据结构)，需要使用json、pickle做序列化

序列化的目的

1、以某种存储形式使自定义对象持久化

2、将对象从一个地方传递到另一个地方。

3、使程序更具维护性。

json
　　dumps loads
　　　　在内存中做数据转换 :
　　　　　　dumps 数据类型转成字符串序列化
　　　　　　loads 字符串转成数据类型反序列化
　　dump load
　　　　直接将数据类型写入文件,直接从文件中读出数据类型
　　　　　　dump 数据类型写入文件序列化
　　　　　　load 文件读出数据类型反序列化

json是所有语言都通用的一种序列化格式

　　只支持列表字典字符串数字

　　字典的key必须是字符串

序列化之后的json没有单引号，只有双引号，因为json只支持双引号

# import json

# 问题1 字典中的int类型，序列化及反序列化后变成字符串类型
# dic = {1: 'value', 2: 'value2'}
# ret = json.dumps(dic)  # 序列化
# print(dic, type(dic))
# print(ret, type(ret))
# res = json.loads(ret)  # 反序列化
# print(res, type(res))


# 问题2 元组变成了列表
# dic = {1: [1, 2, 3], 2: (4, 5, 'aa')}
# ret = json.dumps(dic)  # 序列化
# print(dic, type(dic))
# print(ret, type(ret))
# res = json.loads(ret) # 反序列化
# print(res, type(res))


# 问题3 集合类型不能作为键，序列化
# s = {1, 2, 'aaa'}
# json.dumps(s)

# 问题4 元组不能作为键 # TypeError: keys must be a string
# json.dumps({(1, 2, 3): 123})

# 向文件中记录字典
# dic = {'key1' : 'value1','key2' : 'value2'}
# ret = json.dumps(dic)  # 序列化
# with open('json_file','w') as f:
#     f.write(ret)

# # 从文件中读取字典
# with open("json_file") as f:
#     content = f.read()
# ret = json.loads(content)
# print (ret,content)
# print (type(ret))
# print (type(content))

# load dump 直接操作文件
# dic = {'key1' : 'value1','key2' : 'value2'}
# with open("json_file","w") as f:
#     json.dump(dic,f)

# with open("json_file") as f:
#     ret = json.load(f)
# print (ret["key1"])

# 问题5 不支持连续的存 取
# dic = {'key1' : 'value1','key2' : 'value2'}
# with open('json_file','a') as f:
#     json.dump(dic,f)
#     json.dump(dic,f)
#     json.dump(dic,f)

# with open('json_file','r') as f:
#     dic = json.load(f)
# print(dic.keys())

# 需求 :强行要把一个一个的字典放到文件中,再一个一个取出来?
# dic = {'key1' : 'value1','key2' : 'value2'}

# with open('json_file','w') as f:
#     str_dic = json.dumps(dic)
#     f.write(str_dic+'\n')
#     str_dic = json.dumps(dic)
#     f.write(str_dic + '\n')
#     str_dic = json.dumps(dic)
#     f.write(str_dic + '\n')

# with open('json_file','r') as f:
#     for line in f:
#         dic = json.loads(line.strip())
#         print(dic.keys())

json.dumps()，各个参数含义

Skipkeys：默认值是False，如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None)，设置为False时，就会报TypeError的错误。此时设置成True，则会跳过这类key

ensure_ascii:，当它为True的时候，所有非ASCII码字符显示为\uXXXX序列，只需在dump时将ensure_ascii设置为False即可，此时存入json的中文即可正常显示。)

Iindent：应该是一个非负的整型，如果是0就是顶格分行显示，如果为空就是一行最紧凑显示，否则会换行且按照indent的数值显示前面的空白分行显示，这样打印出来的json数据也叫pretty-printed json

separators：分隔符，实际上是(item_separator, dict_separator)的一个元组，默认的就是(‘,’,’:’)；这表示dictionary内keys之间用“,”隔开，而KEY和value之间用“：”隔开。

sort_keys：将数据根据keys的值进行排序。

import json
data = {'username':['呜呜呜','奋斗奋斗'],'sex':'m','age':24}
json_dic = json.dumps(data,sort_keys=True,indent=4,separators=(',',':'),ensure_ascii=False)
print(json_dic)

pickle

1、支持在python中几乎所有的数据类型
2、dumps 序列化的结果只能是字节
3、只能在python中使用
4、在和文件操作的时候,需要用rb wb的模式打开文
5、可以多次dump 和多次load

import pickle
dic = {(1,2,3):{'a','b'},1:'abc'}

ret1 = pickle.dumps(dic)
print(ret1)

ret2 = pickle.loads(ret1)
print (ret2)

with open('pickle_file','wb') as f:
    pickle.dump(dic,f)

with open('pickle_file','rb') as f:
    ret = pickle.load(f)
    print(ret,type(ret))

用于序列化的两个模块

json，用于字符串和 python数据类型间进行转换

pickle，用于python特有的类型和 python的数据类型间进行转换

pickle模块提供了四个功能：dumps、dump(序列化，存）、loads（反序列化，读）、load （不仅可以序列化字典，列表...可以把python中任意的数据类型序列化）

这既然pickle如此强大，为什么还要学json呢？
这里我们要说明一下，json是一种所有的语言都可以识别的数据结构。
如果我们将一个字典或者序列化成了一个json存在文件里，那么java代码或者js代码也可以拿来用。
但是如果我们用pickle进行序列化，其他语言就不能读懂这是什么了～
所以，如果你序列化的内容是列表或者字典，我们非常推荐你使用json模块
但如果出于某种原因你不得不序列化其他的数据类型，而未来你还会用python对这个数据进行反序列化的话，那么就可以使用pickle

posted @ 2019-09-23 20:39 网瘾小伙阅读(634) 评论(0) 编辑收藏举报

刷新页面返回顶部

网瘾小伙

python3-常用模块之序列化

公告