【爬虫】编码问题总结

request返回的response出现乱码

res.encoding(encode)  # encode为指定的编码
print(res.text)

这是由于直接赋予的编码不对。

print(res.content.decode("unicode-escape"))

需要解析unicode编码

import html
print(html.unescape(res.text))

&#x开头的是一种网页编码格式需要通过html解析

posted @ 2019-03-30 11:29 丿小呆阅读(364) 评论(0) 编辑收藏举报

刷新页面返回顶部