Pillow + pytesseract + tesseract-ocr 破解简单的图形验证码

前言:

我们在做WEB UI自动化测试时,会遇到一些图形验证码,今天就来简单介绍下,如何来识别简单的图形验证码。

 

一、安装

◇ Pillow

pip3 install Pillow

◇ pytesseract

pip3 install pytesseract

◇ tesseract-ocr

下载地址: https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe

 

二、使用

1.在pytesseract源码中将tesseract_cmd=‘’改为本地安装的tesseract-ocr 的目录

 

 

2.如何找到pytesseract.py

按住Ctrl 点击 pytesseract

再次按住Ctrl 点击 ALTONotSupported

搜索tesseract_cmd即可找到

 

三、示例

# coding = utf-8

import pytesseract
from PIL import Image
from PIL import ImageEnhance

def readImage(path):
    img = Image.open(path)  # 根据地址,读取图片
    imgry = img.convert('L')  # 图像加强,二值化
    sharpness = ImageEnhance.Contrast(imgry)  # 对比度增强
    sharp_img = sharpness.enhance(2.0)
    sharp_img.save("bky.png")  # 将处理后的图片,保存为new.png
    image = Image.open('bky.png')  # 打开处理后的图片
    code = pytesseract.image_to_string(image)  # 读取里面的内容
    return code

if __name__=="__main__":
    path = 'img.png'
    pic = readImage(path)
    print("识别结果:",pic)

 

 

                            to be continued...

posted @ 2022-03-31 17:11  莲(LIT)  阅读(139)  评论(0编辑  收藏  举报