会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Chellyyy
博客园
首页
新随笔
联系
订阅
管理
2020年1月8日
nodeJS实现识别验证码(tesseract-ocr+GraphicsMagick)
摘要: 背景 最近在写一个爬虫的小工具,卡在登录这里。 想爬的网站需要登录才能获取数据,登录又需要输入验证码。 好在验证码是简单的验证码,还可以自己识别试试。 需求分析 1、保存验证码图片 2、识别验证码 3、对识别的验证码进行人工校准 功能实现 1、保存验证码图片 虽然每个网站不一定一样,但是大体的思路是
阅读全文
posted @ 2020-01-08 18:35 Chellyyy
阅读(7617)
评论(0)
推荐(1)
编辑
公告