www.cnblogs.com/ruiyqinrui

开源、架构、Linux C/C++/python AI BI 运维开发自动化运维。 春风桃李花 秋雨梧桐叶。“力尽不知热 但惜夏日长”。夏不惜,秋不获。@ruiY--秦瑞

python爬虫,C编程,嵌入式开发.hadoop大数据,桉树,onenebula云计算架构.linux运维及驱动开发.

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
python 转换为json时候 汉字编码问题

有这样一个需求:

      需要一个json 文件 数据从数据库里查询出来

1. 设置文件头

 

[python] view plain copy
 
  1. # -*- coding:utf-8 -*-    

 

 

2. 连接数据库 将数据库连接数据库的编码设置为utf8    
[python] view plain copy
 
  1. db = MySQLdb.connect(host='数据库,user=用户名,passwd=密码,db='数据库, init_command="set names utf8" )    

 

3.  查询出来的数据转化为json

 

[python] view plain copy
 
  1. t = json.dumps(r, ensure_ascii=False)    
如果 不加 ensure_ascii=False  输出的 t 如果有汉字的话都默认给转换成一堆编码 如果加上的话 就都能正常显示变成了汉字

 

 

不加的话: t = json.dumps(r)

 

[html] view plain copy
 
  1. [{"category": {"label": "\u65b0\u8f66"}, "title": "\u5168\u65b0\u8d77\u4e9a\u798f\u745e\u8fea\u8def\u8bd5\u8c0d\u7167\u66dd\u5149 \u6216\u4e3a\u5b9a\u540dK3", "url": "http://auto.sohu.com/20120523/n343878794.shtml", "source": "\u641c\u72d0\u6c7d\u8f66", "time": 1337740004, "imgUrl": ""}, {"category": {"label": "\u65b0\u8f66"}, "title": "\u65b0\u5965\u8feaQ7/Q8\u66f4\u591a\u4fe1\u606f\u66dd\u5149 \u5c06\u57fa\u4e8eMLB\u5e73\u53f0", "url": "http://auto.sohu.com/20120523/n343873150.shtml", "source": "\u641c\u72d0\u6c7d\u8f66", "time": 1337737913, "imgUrl": ""}]    

 

加上的话:  t = json.dumps(r, ensure_ascii=False)

 

[html] view plain copy
 
  1. [{"category": {"label": "新车"}, "title": "全新起亚福瑞迪路试谍照曝光 或为定名K3", "url": "http://auto.sohu.com/20120523/n343878794.shtml", "source": "汽车", "time": 1337740004, "imgUrl": ""}, {"category": {"label": "新车"}, "title": "新奥迪Q7/Q8更多信息曝光 将基于MLB平台", "url": "http://auto.sohu.com/20120523/n343873150.shtml", "source": "汽车", "time": 1337737913, "imgUrl": ""}]   


 

我们在post请求数据时,响应的内容是json数据,但是返回的json数据中文显示有问题,变成 \uXXX的形式。这是因为中文以 unicode 编码了,而默认是以ASCII解析的,中文不在ASCII编码中,所以无法显示。

这时候我们可以用 import json 然后调用json.loads() 和json.dumps()来使中文正确显示。 下面的代码(data是中文不能正常显示的json串,newjson是处理后中文正常显示的字符串)

 

[python] view plain copy
 
  1. import json  
  2. myjson=json.loads(data) #data是向 api请求的响应数据,data必须是字符串类型的  
  3. newjson=json.dumps(myjson,ensure_ascii=False)   #ensure_ascii=False 就不会用 ASCII 编码,中文就可以正常显示了  
  4.    
  5. print newjson  
posted on 2018-05-15 16:11  秦瑞It行程实录  阅读(5064)  评论(0编辑  收藏  举报
www.cnblogs.com/ruiyqinrui