摘要: Selenium+Tesseract-OCR智能识别验证码爬取网页数据 1.项目需求描述 通过订单号获取某系统内订单的详细数据,不需要账号密码的登录验证,但有图片验证码的动态识别,将获取到的数据存到数据库。 2.整体思路 1.通过Selenium技术,无窗口模式打开浏览器 2.在输入框中动态输入订单号 3.将图片验证码截图保存到本地 4.通过Tesseract-OCR技 阅读全文
posted @ 2021-09-27 09:55 大数据智工厂 阅读(376) 评论(0) 推荐(0) 编辑