python抓网页中文乱码问题
import urllib2
import sys
content = urllib2.urlopen("http://www.higis.cn").read() #网站页面是utf-8编码的。
type = sys.getfilesystemencoding() # 关键
print content.decode("UTF-8").encode(type) # 关键
import sys
content = urllib2.urlopen("http://www.higis.cn").read() #网站页面是utf-8编码的。
type = sys.getfilesystemencoding() # 关键
print content.decode("UTF-8").encode(type) # 关键