2022 年 11月 23 日随笔档案 - kuba8

2022年11月23日

摘要：解决思路1、循环暴力寻找编码，但是不如思路3 def parse(self, response): print(response.text[:100]) body = response.body#直接是bytes,response.text是str encodings = ['utf-8', 'g 阅读全文

posted @ 2022-11-23 14:45 kuba8 阅读(300) 评论(0) 推荐(0) 编辑

scrapy xpath遇见乱码解决

摘要：首先查看页面的编码模式 response.encoding 显示为'cp1252' response.xpath("//title/text()").getall()[0].encode('cp1252').decode('gbk') 解决。阅读全文

posted @ 2022-11-23 11:15 kuba8 阅读(264) 评论(0) 推荐(0) 编辑

kuba8

公告