图形验证码的识别
前提工作:识别图形验证码需要库tesserocr
把图形验证码保存到项目根目录,然后利用程序识别
方法1:
import tesserocr from PIL import Image image = Image.open('code2.jpg') result = tesserocr.image_to_text(image) print(result)
方法2:识别度较差
import tesserocr print(tesserocr.file_to_text('code.jpg'))
方法3:做一些灰度处理和二值化处理,推荐使用
import tesserocr from PIL import Image image = Image.open('code2.jpg') image = image.convert('L') threshold = 127 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) image = image.point(table, '1') image.show() result = tesserocr.image_to_text(image) print(result)
注意:
使用这样的识别方法存在如下两种情况:
1.识别有误
2.完全识别不出来