-----使用技术手段解决问题,坚信注重每一个细节,把熟悉的做到一种极致,一定会有创新出现。-----

Python识别验证码的开源工具

各位“蜘蛛侠”们大家可能在抓取页面中的验证码而耿耿于怀,关于这点我想我目前可能能帮助下大家,在python中找到最接近与“杀手级别”的工具(源于开源,好东西不敢独享)。

调下大家的积极性 ,上图

Python的验证码识别开源工具_15851

python 包>> pytesser| http://code.google.com/p/pytesser/(其实 py包 使用很简单的,关键在安装

1. 首先安装 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging

2. pytesser 依赖包 
tesseract-ocr|  http://code.google.com/p/tesseract-ocr/downloads/list 

tesseract-ocr 依赖库| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解压到 你安装的tesseract-ocr的识别学习库下。
posted @ 2013-03-12 14:18  ZhuQue  阅读(4746)  评论(5编辑  收藏  举报
多年性能测试、测试管理经验,专注银行、支付、电商行业,倾向于性能、安全、 监控、调优、模型、管理等方向的研究。
使用技术手段解决问题,坚信注重每一个细节,把熟悉的做到一种极致,一定会有创新出现。