摘要: 代码 # Define here the models for your spider middleware # # See documentation in: # https://docs.scrapy.org/en/latest/topics/spider-middleware.html imp 阅读全文
posted @ 2024-03-03 21:58 会秃头的小白 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 背景:解析 站长素材首页的图片 看程序执行 在我执行完程序之后显示爬取成功 但是并没有爬取到图片 找错过程 把settings中的LOG_LEVEL = "ERROE"改成WARNING 就发现了警告信息 于是我又进行输出url 发现了本身爬取的url没有问题 但是用Request解析的时候就发现了 阅读全文
posted @ 2024-03-03 21:02 会秃头的小白 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 笔记 - 图片数据爬取之ImagesPipeline - 基于scrapy爬取字符串类型的数据和爬取图片类型的数据区别? - 字符串:只需要基于xpth进行解析且提交管道进行持久化存储 - 图片:xpath解析出图片src属性值。单独的对图片地址发起请求获取图片二进制类型的数据 - ImagesPi 阅读全文
posted @ 2024-03-03 18:11 会秃头的小白 阅读(71) 评论(0) 推荐(0) 编辑