摘要: 爬虫的核心思想:模拟浏览器正常访问服务器,一般情况只要浏览器能访问的,都可以爬,如果被反爬,则考虑反复测试添加Request Header数据,知道可以爬取为止。 反爬思路目前知道的有:User Agent,Cookie,Referer,访问速度,验证码,用户登录及前端js代码验证等。本例遇到js验 阅读全文
posted @ 2018-06-17 17:49 silence-cc 阅读(355) 评论(1) 推荐(0) 编辑