摘要: 3.10 关于爬取时,网页编码不是utf-8,而导致 lxml 输出中文时乱码的解决办法 用requests.get拿到response,response.content是bytes的内容,所以可以直接传给 lxml, body = etree.HTML(response.content)就不会有乱 阅读全文
posted @ 2017-03-10 11:12 Nanrou 阅读(2945) 评论(0) 推荐(0) 编辑