[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

问题:

  • cmd里直接print的时候报错
  • 之前已经测试了一个页面,编码没有问题。这是在爬类似页面的时候报的错

思路:

  • 因为这个看上去不是整体的编码问题,所以我直接查看了报错的字符编码'\xa0',发现这个是unicode下的'&nbps',而这个编码不存在于gbk里

尝试:

  • replace(u'\xa0', u' ') - 报同一个错,不知道为什么。。。
  • encode('gbk', 'ignore').decode('gbk') - 解决
posted @ 2018-05-27 07:43  break大蜗牛  阅读(196)  评论(0编辑  收藏  举报