2018 年 6月 17 日随笔档案 - silence-cc

2018年6月17日

摘要：爬虫的核心思想：模拟浏览器正常访问服务器，一般情况只要浏览器能访问的，都可以爬，如果被反爬，则考虑反复测试添加Request Header数据，知道可以爬取为止。反爬思路目前知道的有：User Agent，Cookie，Referer，访问速度，验证码，用户登录及前端js代码验证等。本例遇到js验阅读全文

posted @ 2018-06-17 17:49 silence-cc 阅读(357) 评论(1) 推荐(0) 编辑

silence-cc

现在的努力决定你未来站立的高度,所立之处决定你看到什么样的风景

公告