文字编码的问题

在Python 底下,所有字符的编码都是要经过unicode来处理的(2.7.5版本是这样的,3.x到底是不是没亲测).所以要显示一段文字的话

  1. 根据原文件的编码来解码,生成unicode编码
  2. 将unicode编码转换成目标编码格式
1 import urllib2
2 content=urllib2.urlopen('http://www.yxdown.com/gonglue/82039_14.html').read()
3 print content.decode('gbk').encode('utf8')

 

posted @ 2013-08-21 16:52  hhhyde  阅读(207)  评论(0编辑  收藏  举报