随笔 - 172  文章 - 52  评论 - 6  阅读 - 17万

selenium简单识别验证码

  selenium简单识别验证码,识别验证码图片,不太精准,原理上是这样:

import subprocess

#验证png图片不报错,可以识别图片为文字,但是不精准,jpg也可以识别,但是会报错,也会生出txt文档
#第一个是安装的Tesseract-OCR的路径,第二个是验证码的图片的路径
p=subprocess.Popen([r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe",r"D:\python爬虫视频\爬虫代码\seleniumText\1.png","last"],stdout=subprocess.PIPE,stderr=subprocess.PIPE)
p.wait()
file=open("last.txt","r")
print(file.read())

 

posted on   共感的艺术  阅读(224)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示