文字编码的问题
在Python 底下,所有字符的编码都是要经过unicode来处理的(2.7.5版本是这样的,3.x到底是不是没亲测).所以要显示一段文字的话
- 根据原文件的编码来解码,生成unicode编码
- 将unicode编码转换成目标编码格式
1 import urllib2 2 content=urllib2.urlopen('http://www.yxdown.com/gonglue/82039_14.html').read() 3 print content.decode('gbk').encode('utf8')