Python json和simplejson的使用
在Python中,json数据和字符串的转换可以使用json模块或simplejson模块。
json从Python2.6开始内置到了Python标准库中,我们不需要安装即可直接使用。
simplejson需要安装后才可以使用。
一、安装simplejson
pip install simplejson
二、使用json和simplejson将json格式的数据转换成字符串
import json
import simplejson
list_json = [{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
print(type(list_json))
json_str = json.dumps(list_json, ensure_ascii=False)
print(json_str)
print(type(json_str))
simplejson_str = simplejson.dumps(list_json, ensure_ascii=False)
print(simplejson_str)
print(type(simplejson_str))
运行结果:
[{"a": "bbb"}, {"c": "ddd"}, {"e": "fff"}]
[{"a": "bbb"}, {"c": "ddd"}, {"e": "fff"}]
json和simplejson都提供了dump()和dumps(),dump是用于将内容转json字符串后写入文件中,dumps是将json格式的数据(字典或字典组成的列表)转换成json字符串。
在dumps对数据进行处理时,会做encoding(编码)操作,dumps()中的ensure_ascii默认是为True的,会将中文也编码成ascii,所以我们指定ensure_ascii=False。
三、使用json和simplejson将json字符串转换成其他数据
json_list = json.loads(json_str, encoding='utf-8', strict=False)
print(json_list)
print(type(json_list))
simplejson_list = simplejson.loads(simplejson_str, encoding='utf-8', strict=False)
print(simplejson_list)
print(type(simplejson_list))
运行结果:无锡人流多少钱 http://www.bhnfkyy.com/
[{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
[{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
json和simplejson都提供了load()和loads(),load与dump对应,是用于从文件中读取json字符串然后进行转换的,loads是将json字符串直接转换成Python数据类型。
在使用loads对json字符串进行转换时,有时候可能因为json字符串的格式不是完全的符合json格式,会造成loads报错,这时候我们可以设置参数strict=False,表示loads()时,不严格检查json格式。
Bug描述:
在使用json.loads()将json字符串转换成json数据时,报错信息:Expecting ',' delimiter line l column .. (char ..),还遇到过这种报错:Expecting ',' delimiter or '}': line l column .. (char ..)
这都是因为json字符串的样式不是合法的json格式,一般这种情况是从数据库中读数据时或者从文件中读数据时会发生.
最常出现的就是数据里面有双引号",并且双引号前没有反斜杠转义。所以在使用json.loads()时要先确认要loads()的json字符串是否合法。如果有双引号则要有反斜杠转义。
解决方法:
如果出现了上面的报错,可以检查是否有不合法的字符,如有双引号,可以将双引号进行转义,避免解析时将其识别为json的双引号造成双引号多了报错,如果里面有带反斜杠\的url链接,可以将反斜杠\替换成斜杠/。
可以通过re正则进行匹配替换,或者用字符串的replace()方法替换。