python中文乱码

windows下：

1、字符串为u'',则直接打印不会出现乱码

2、若未加特定指示，则可用decode('utf-8'),一般是可以的，只要编码解码对应就不会出错了

实在无法解决，就是系统默认编码不是utf-8,则将文本用utf8解码然后用系统默认编码编码，用于网页抓取中文乱码比较好
import sys
type = sys.getfilesystemencoding()
print content.decode("UTF-8").encode(type)

一般这样就可以了，文件头加上#coding:utf-8,我的系统默认mbcs编码

（windows下ipython的中文乱码）

posted @ 2016-05-02 16:53 一条码虫阅读(204) 评论(0) 编辑收藏举报

刷新页面返回顶部

一条码虫