浙江省高等学校教师教育理论培训

微信搜索“毛凌志岗前心得”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

[CPyUG] 抓取网页数据时遇到的中文编码问题

解释一下
from __future__ import unicode_literals
python2在windows环境中,由于系统内码是gbk,所以当有
# coding:utf-8
的时候,你要输出文字必须:
print u'要输出的文字'
否则就是乱码。这是因为默认字符串实际上是字节串,并非宽字符集。
from __future__ import unicode_literals
这句话的作用就是让默认字符串变成宽字符集,这样你可能会少进行一次转换,
有利于跨平台和实现py2与py3兼容。
posted on 2012-04-10 22:53  lexus  阅读(177)  评论(0编辑  收藏  举报