python验证码识别PIL+pytesseract
1.需要模块安装
在python安装目录scripts即:
执行pip install pillow
下载tesseract-ocr-setup-4.00.00dev.exe 安装,我的目录在C盘默认
执行pip install pytesseract
2.上传测试案例
3.示例代码
图片处理过程:
1 from PIL import Image 2 from pytesseract import * 3 import PIL.ImageOps 4 5 def initTable(threshold=140): 6 table = [] 7 for i in range(256): 8 if i < threshold: 9 table.append(0) 10 else: 11 table.append(1) 12 return table 13 14 im = Image.open('new.jpg') 15 #图片的处理过程 16 im = im.convert('L') 17 #像素点处理 二值图像,非黑即白 相当于去噪操作 18 binaryImage = im.point(initTable() , '1') 19 #binaryImage.show() 20 #模式“L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度 21 imgl = binaryImage.convert('L') 22 #输入图像转换为反色图像 23 imginvert = PIL.ImageOps.invert(imgl) 24 #imginvert.show() 25 vercode = pytesseract.image_to_string(imginvert) 26 print (vercode)
识别结果:
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步