会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大数据智工厂
IoT数智星
博客园
首页
新随笔
联系
订阅
管理
2021年9月27日
Selenium+Tesseract-OCR智能识别验证码爬取网页数据
摘要:
1.项目需求描述 通过订单号获取某系统内订单的详细数据,不需要账号密码的登录验证,但有图片验证码的动态识别,将获取到的数据存到数据库。 2.整体思路 1.通过Selenium技术,无窗口模式打开浏览器 2.在输入框中动态输入订单号 3.将图片验证码截图保存到本地 4.通过Tesseract-OCR技
阅读全文
posted @ 2021-09-27 09:55 大数据智工厂
阅读(422)
评论(0)
推荐(0)
编辑
公告