python中文乱码

windows下:

1、字符串为u'',则直接打印不会出现乱码

 

2、若未加特定指示,则可用decode('utf-8'),一般是可以的,只要编码解码对应就不会出错了

 

   实在无法解决,就是系统默认编码不是utf-8,则将文本用utf8解码然后用系统默认编码编码,用于网页抓取中文乱码比较好
import sys
type = sys.getfilesystemencoding()  
print content.decode("UTF-8").encode(type) 

一般这样就可以了,文件头加上#coding:utf-8,我的系统默认mbcs编码

(windows下ipython的中文乱码)

 

posted @ 2016-05-02 16:53  一条码虫  阅读(202)  评论(0编辑  收藏  举报