Fork me on GitHub
摘要: 模拟登录淘宝已经不是一件新鲜的事情了,过去我曾经使用get/post方式进行爬虫,同时也加入IP代理池进行跳过检验,但随着大型网站的升级,采取该策略比较难实现了。因为你使用get/post方式进行爬取数据,会提示需要登录,而登录又是一大难题,需要滑动验证码验证。当你想使用IP代理池进行跳过检验时,发现登录时需要手机短信验证码验证,由此可以知道旧的全自动爬取数据对于大型网站比较困难了。 阅读全文
posted @ 2019-03-13 16:49 云外孤鸟 阅读(13722) 评论(5) 推荐(2) 编辑
摘要: 免责声明: 1. 在根据本教程进行实际操作时,如因您操作失误导致出现的一切意外,包括但不限于路由器变砖、故障、数据丢失等情况,概不负责; 2. 该技术仅供学习交流,请勿将此技术应用于任何商业行为,所产生的法律责任由您自行承担; 3. 部分学校明令禁止使用路由器上网,相关文件请点击 "广东工业大学校园 阅读全文
posted @ 2019-02-20 15:30 云外孤鸟 阅读(26121) 评论(1) 推荐(2) 编辑