吉阿吉

2021年5月4日

scrapy中ImagePipeline及图片懒加载

摘要: 在网页源码中,在img标签中首先会使用一个“伪属性”(通常使用src2,original......)去存放真正的图片链接而并非是直接存放在src属性中。当图片出现到页面的可视化区域中,会动态将伪属性替换成src属性,完成图片的加载。爬虫是使用伪属性解析。 ImagesPipeline: class 阅读全文

posted @ 2021-05-04 15:46 吉阿吉 阅读(388) 评论(0) 推荐(0)

导航