摘要: 使用python、scrapy 看了不少博客是要用到模拟浏览器phantomjs、chrome什么的,在实际应用,效率真的慢的可怕,所以这样的方法抛弃!(其实还有好多网站的js会发现这种操作) 废话不多说,开始: 首先从楼主要研究的网站说起(具体网站就不公布了,fiddler抓包之类的也不多说),首 阅读全文
posted @ 2019-03-31 22:23 retime123 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 今日头条加密http://www.cnblogs.com/xuchunlin/p/7097391.html 非常感谢! 参考网站:http://blog.csdn.net/u011475134/article/details/70198533 参考网站:http://www.jianshu.com/ 阅读全文
posted @ 2017-12-13 17:52 retime123 阅读(3667) 评论(5) 推荐(2) 编辑
摘要: simhash是什么网上有一大片的文章,我就不多说了 分享一下别人的博客http://blog.csdn.net/madujin/article/details/53152619,http://blog.csdn.net/heiyeshuwu/article/details/44117473 在实现 阅读全文
posted @ 2017-09-13 20:21 retime123 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 验证码很让人头疼 极验,现在6.0版本来了,用这种方式实现,通过率只有一成!! 极验的机器学习太强了,可以考虑换IP实现! 还有一点是轨迹!!可以考虑使用已经成功的历史轨迹来作为当前的轨迹!! 网上有太多的破解方法我就不多说了 源码分享 guesst/ 感谢https://github.com/da 阅读全文
posted @ 2017-09-13 19:54 retime123 阅读(4077) 评论(0) 推荐(0) 编辑
摘要: 特别说明,本文是在Windows64位系统下进行的,32位系统请下载相应版本的安装包,安装方法类似。 使用python开发,环境有Python2和 python3 两种,有时候需要两种环境切换使用,下面提供详细教程一份。 1、下载python3和python2 进入python官网,链接https: 阅读全文
posted @ 2017-06-15 13:42 retime123 阅读(2197) 评论(0) 推荐(0) 编辑
摘要: 遇到的原型是这样的!下面我把它简化一下; click事件: 在浏览器里面只能获取横线上面的值,和下面的第一个值!! 这是因为id等级比class高,而且js要求id不能重复! 当 阅读全文
posted @ 2017-06-07 22:32 retime123 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 每次都要查看ip,每次都不一样,往往我们会选择“NAT模式”,但是选择的时候,ip地址会产生冲突,这样我们就要修改我们的IP地址来解决!! 一、简单方式: 1.工具栏‘编辑’ 2.虚拟网络编辑器,选择NAT模式==》子网ip没法修改 3.‘更改设置’ “子网IP”修改自己喜欢的网段,192.168. 阅读全文
posted @ 2017-05-20 23:07 retime123 阅读(3353) 评论(0) 推荐(0) 编辑
摘要: 小生的一点见解 阅读全文
posted @ 2017-05-13 23:09 retime123 阅读(129) 评论(0) 推荐(0) 编辑