07 2018 档案

摘要:今天闲的无聊,爬取了一个网站,百度百聘,仅供学习参考 直接上代码: 这个网址没有什么难度,只需要简单的请求一下请求接口就能得到数据,注意请求参数 city 需要 URL编码一下就可以,不会的同学请自行百度 URL编码 就可以了 阅读全文
posted @ 2018-07-30 17:56 淋哥 阅读(1797) 评论(0) 推荐(1) 编辑
摘要:爬取某个网站,可以通过修改下拉框来实现数据批量加载 上图我们可以看到 view 下面的下拉框 的值是25 ,50 ,100 ,200。我们把200的值修改为5200,然后提交页面 然后直接出来所有的数据,不在需要做翻页: 爽不爽啊,请求的时候注意把cookie复制到请求头里面,有些网站是通过cook 阅读全文
posted @ 2018-07-17 15:57 淋哥 阅读(2512) 评论(0) 推荐(0) 编辑
摘要:切割前: 切割后: 代码: 思路是用深度遍历,对图片进行二值化处理,先找到一个黑色像素,然后对这个像素的周围8个像素进行判断,如果没有访问过,就保存起来,然后最后这个数组的最小x和最大x就是x轴上的切割位置。这种分割的方法还是只能适用于没有粘连的验证码,比垂直分割的好处是,可以处理位置比较奇怪的验证 阅读全文
posted @ 2018-07-10 18:30 淋哥 阅读(5233) 评论(0) 推荐(0) 编辑
摘要:备注(易拍全球) 切割前: 切割后: 切割前: 切割后: 好了,上代码: 阅读全文
posted @ 2018-07-10 17:15 淋哥 阅读(1988) 评论(0) 推荐(0) 编辑
摘要:原来验证码: 切割前: 切割后: 切割前: 切割后: 切割前: 切割后: 切割前: 切割后: 切割前: 切割后: 直接上代码: 说明: 本切割算法适合验证码中的字母位置基本固定在一定的范围内,有比较好的切割效果 阅读全文
posted @ 2018-07-07 16:52 淋哥 阅读(4790) 评论(0) 推荐(0) 编辑
摘要:处理器图像: 处理后图像: 代码: 阅读全文
posted @ 2018-07-05 17:48 淋哥 阅读(2081) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示