tesserocr 使用:
简单识别:
import tesserocr
from PIL import Image
image = Image.open('code.jpg')
result = tesserocr.image_to_text(image)
print(result)
多余线条干扰:
处理步骤
处理步骤:
1. 转灰度:
Image对象的convert()方法参数传人L,即可将图片转化为灰度图像
image = image.convert('L')
image.show()
2. 图片进行二值化处理:
image = image.convert('1')
image.show()
采用的是默认阔值127。不能直接转化原因,要将原图先转为灰度图像,然后再指定二值化阔
image = image.convert('L')
threshold = 80
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
image = image.point(table,'1')
image.show()
-》 验证码中的线条已经去除,整个验证码变得黑向分明,重新识别验证码
import tesserocr
from PIL import Image
image = Image.open('code.jpg')
image = image.convert('L')
threshold = 127
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
image = image.point(table,'1')
result = tesseroct.image_to_text(image)
print(result)
--> 针对一些有干扰的图片,做一些灰度和二值化处理,会提高图片识别的正确度
项目地址:
代码地址为:https://github.comPython3WebSpider/CracklmageCod
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp
· Vite CVE-2025-30208 安全漏洞
· 《HelloGitHub》第 108 期
· MQ 如何保证数据一致性?
· 一个基于 .NET 开源免费的异地组网和内网穿透工具