返回顶部
扩大
缩小

Zhang_derek

2018年8月3日

21天打造分布式爬虫-Selenium爬取拉钩职位信息(六)

摘要: 6.1.爬取第一页的职位信息 第一页职位信息 6.2.爬取所有页的职位信息 阅读全文

posted @ 2018-08-03 23:20 zhang_derek 阅读(1200) 评论(0) 推荐(0) 编辑

21天打造分布式爬虫-多线程下载表情包(五)

摘要: 5.1.threading模块 简单使用 5.2.生产者和消费者 Lock模式的生产者和消费者 5.3.下载表情包 网址:http://www.doutula.com/photo/list/?page=1 解析:xpath 不用多线程,速度相对会很慢 利用多线程 main() 定义两个队列,和创建多 阅读全文

posted @ 2018-08-03 01:58 zhang_derek 阅读(1070) 评论(1) 推荐(1) 编辑

导航