Python - PIL-pytesseract-tesseract验证码识别
N天前实现了简单的验证识别,这玩意以前都觉得是高大上的东西,一直没有去研究,这次花了点时间研究了一下,当然只是一些基础的东西,高深的我也不会,分享一下给大家吧。
关于python验证码识别库,网上主要介绍的为pytesser及pytesseract,其实pytesser的安装有一点点麻烦,所以这里我不考虑,直接使用后一种库。
要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。
一、安装PIL
PIL : Pillow-3.3.0-cp27-cp27m-win_amd64.whl 或 Pillow-4.2.1.win-amd64-py2.7.exe
下载地址:https://pypi.python.org/pypi/Pillow/4.2.1
然后执行安装命令:
pip install Pillow-4.2.1-cp27-cp27m-win_amd64.whl
或是点击exe进行安装,一路下一步
二、安装Tesseract
介绍见链接
下载安装文件地址:http://jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe
安装过程如下(这是一个缓慢且会报错的过程):
三 、安装pytesseract
执行命令:
pip install pytesseract
![](https://images2017.cnblogs.com/blog/1213900/201709/1213900-20170928235314012-2087297102.png)
根据经验,安装成功后要重启计算机,要不然执行如下代码会报错。
import pytesseract from PIL import Image image=Image.open('new.jpg') print image vcode=pytesseract.image_to_string(image) print vcode
new.jpg
![](http://files.cnblogs.com/files/BlueSkyyj/zfbd.bmp)
您的资助是我最大的动力!
金额随意,欢迎来赏!
![](http://files.cnblogs.com/files/BlueSkyyj/wxzf.bmp)
您的资助是我最大的动力!
金额随意,欢迎来赏!
如果,您希望更容易地发现我的新博客,不妨点击一下绿色通道的
因为,我的写作热情也离不开您的肯定与支持,感谢您的阅读,我是【Blue·Sky】!
【China-测试开发】技术交流群期待你的加入【 193056556 】
【欢迎扫码关注:日益】微信订阅号【 riyi18 】