python抓网页中文乱码问题

import urllib2
import sys
content = urllib2.urlopen("http://www.higis.cn").read()   #网站页面是utf-8编码的。

type = sys.getfilesystemencoding()   # 关键
print content.decode("UTF-8").encode(type)  # 关键
posted on 2010-05-27 16:40  jerry data  阅读(4521)  评论(0编辑  收藏  举报