编码问题:UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0'

练习一个爬虫,报了如下错误:
# UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position 148:
# illegal multibyte sequence

(1)出现UnicodeEncodeError –> 说明是Unicode编码时候的问题;
(2) ‘gbk’ codec can’t encode character –> 说明是将Unicode字符编码为GBK时候出现的问题;
此时,往往最大的可能就是,本身Unicode类型的字符中,包含了一些无法转换为GBK编码的一些字符。

str_html.replace(u'\xa0', u' ')  

将'\xa0‘替换成u' '空格。

posted on 2018-03-06 16:10  明日边缘-道法自然  阅读(241)  评论(0编辑  收藏  举报