Python——验证码识别 Pillow + tesseract-ocr

至于安装教程在这里不再重复说了,可以参考博客,网上有大把的教程

https://blog.csdn.net/testcs_dn/article/details/78697730

要是别的验证码是如下类型的

 

              

 

Python 代码如下

 

复制代码
#!/usr/bin/python
# -*- coding:utf-8 -*-
from PIL import Image
import pytesseract

def recognize_captcha(img_path):
    im = Image.open(img_path).convert("L")
    threshold = 140
    table = []
    for i in range(256):
        if i < threshold:
            table.append(0)
        else:
            table.append(1)

    out = im.point(table, '1')
    num = pytesseract.image_to_string(out)
    return num


if __name__ == '__main__':

    img_path = "D:\\1flower\\test2.jpg"
    res = recognize_captcha(img_path)
    strs = res.split("\n")
    if len(strs) >=1:
        print (strs[0])
复制代码

 

posted @   淋哥  阅读(684)  评论(1编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
点击右上角即可分享
微信分享提示