环境准备:
1、
git文档地址:https://digi.bib.uni-mannheim.de/tesseract/
百度网盘下载地址:
链接:https://pan.baidu.com/s/16RoJ19WynWOKI4Zpr0bKzA
提取码:5hst
下载后右击安装即可
2、
编辑 系统变量里面 path,添加下面的安装路径:D:\Program Files\Tesseract-OCR(填写自己的实际安装路径)
3、安装python的第三方库:
pip install pillow #一个python的图像处理库,pytesseract依赖
pip install pytesseract
4、修改pytesseract.py文件,指定tesseract.exe安装路径
编辑pytesseract.py文件(此步骤必须做,否则运行代码时会报错):
tesseract_cmd = 'D:\Program Files\Tesseract-OCR'
代码实现
验证码识别方法之一,简单验证码,代码可直接使用
import requests
from PIL import Image
import pytesseract
# 验证码地址
url = "http://cloud.xxxx.com/checkCode?0.7337270680854053"
response = requests.get(url).content
#将图片写入文件
with open('test.png','wb') as f:
f.write(response)
#识别验证码
#第一步:通过内置模块PIL打开文件
image = Image.open('test.png')
image = image.convert('L') #转化为灰度图
threshold = 160 #设定的二值化阈值
table = [] #table是设定的一个表,下面的for循环可以理解为一个规则,小于阈值的,就设定为0,大于阈值的,就设定为1
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
image = image.point(table,'1') #对灰度图进行二值化处理,按照table的规则(也就是上面的for循环)
image.show()
result = pytesseract.image_to_string(image) #对去噪后的图片进行识别
print('图片内容为:',result)
分类:
python自动化测试
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp
· 一个基于 .NET 开源免费的异地组网和内网穿透工具
· 《HelloGitHub》第 108 期
· Windows桌面应用自动更新解决方案SharpUpdater5发布
· 我的家庭实验室服务器集群硬件清单