会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Jrri
博客园
首页
新随笔
管理
2020年3月27日
爬取思想流程
摘要: 爬取思想流程 最近两天写爬虫比较多, 总结一下书写爬虫的思路步骤. 获取url. 浏览器打开. 如果无法直接打开, 则判断哪里有验证,根据平台修改User Agent等请求头. 信息页面路径上是否有所验证. 登录验证, IP验证. 有则一一解决. 登录验证 登录验证主要分两种: 图片验证: 抓下图片
阅读全文
posted @ 2020-03-27 01:37 Jrri
阅读(167)
评论(0)
推荐(0)
编辑