会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
李白斗酒诗百篇
博客园
首页
新随笔
联系
订阅
管理
2020年6月20日
使用scrapy实现去重,使用Redis实现增量爬取
摘要: 面试场景: 要求对正在爬取的内容与mysql数据库中的数据进行比较去重 解决方式: 通过Redis来作为中间件,通过url来确保爬过的数据不会再爬,做到增量爬取。 Redis数据库其实就是一个中间件,因为爬虫爬取的数据并不能直接拿去和MySQL中的数据进行比较。那我们就需要将MySQL数据库现有的数
阅读全文
posted @ 2020-06-20 18:39 李白斗酒诗百篇
阅读(251)
评论(0)
推荐(0)
编辑
公告