python中文乱码
windows下:
1、字符串为u'',则直接打印不会出现乱码
2、若未加特定指示,则可用decode('utf-8'),一般是可以的,只要编码解码对应就不会出错了
实在无法解决,就是系统默认编码不是utf-8,则将文本用utf8解码然后用系统默认编码编码,用于网页抓取中文乱码比较好
import sys
type = sys.getfilesystemencoding()
print content.decode("UTF-8").encode(type)
一般这样就可以了,文件头加上#coding:utf-8,我的系统默认mbcs编码
(windows下ipython的中文乱码)