摘要: scrapy-redis是一个基于redis的scrapy组件,通过它可以快速实现简单分布式爬虫程序,该组件本质上提供了三大功能: scheduler - 调度器 dupefilter - URL去重规则(被调度器使用) pipeline - 数据持久化 scrapy-redis组件 1. URL去 阅读全文
posted @ 2018-07-23 22:03 小黑啊小黑 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 安装python3.6可能使用的依赖 yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap 阅读全文
posted @ 2018-07-23 17:56 小黑啊小黑 阅读(3661) 评论(0) 推荐(0) 编辑