Pillow + pytesseract + tesseract-ocr 破解简单的图形验证码
前言:
我们在做WEB UI自动化测试时,会遇到一些图形验证码,今天就来简单介绍下,如何来识别简单的图形验证码。
一、安装
◇ Pillow
pip3 install Pillow
◇ pytesseract
pip3 install pytesseract
◇ tesseract-ocr
下载地址: https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe
二、使用
1.在pytesseract源码中将tesseract_cmd=‘’改为本地安装的tesseract-ocr 的目录
2.如何找到pytesseract.py
按住Ctrl 点击 pytesseract
再次按住Ctrl 点击 ALTONotSupported
搜索tesseract_cmd即可找到
三、示例
# coding = utf-8 import pytesseract from PIL import Image from PIL import ImageEnhance def readImage(path): img = Image.open(path) # 根据地址,读取图片 imgry = img.convert('L') # 图像加强,二值化 sharpness = ImageEnhance.Contrast(imgry) # 对比度增强 sharp_img = sharpness.enhance(2.0) sharp_img.save("bky.png") # 将处理后的图片,保存为new.png image = Image.open('bky.png') # 打开处理后的图片 code = pytesseract.image_to_string(image) # 读取里面的内容 return code if __name__=="__main__": path = 'img.png' pic = readImage(path) print("识别结果:",pic)
to be continued...