会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
阿布alone
博客园
首页
新随笔
订阅
管理
2019年5月16日
去哪儿
摘要: ''' 爬取去哪儿网所有城市自由行数据 爬取速度过快时会引发服务器返回错误 反反爬策略:设置cookies池和ip代理池以及延长爬虫休眠时间 ''' import requests import time from urllib.parse import quote from multiprocessing import Pool import pymongo import random de...
阅读全文
posted @ 2019-05-16 18:03 阿布_alone
阅读(619)
评论(0)
推荐(0)
编辑
公告
TOP