python之图像识别

1. 安装配置

1、pip install pytesseract

2、pip install pillow

3、安装tesseract-ocr:http://jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe

4、找到 pytesseract.py 更改 tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

5、添加环境变量(变量名:TESSDATA_PREFIX,变量值:C:\Program Files (x86)\Tesseract-OCR,即安装目录)

6、如果识别中文,下载 chi_sim.traineddata,并拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata目录下

 

2.识别中文

2.1图片

2.2 运行程序

#!/usr/bin/env python
# -*- codinfg:utf-8 -*-
'''
@author: Jeff LEE
@file: 图片识别.py
@time: 2018-07-20 10:59
@desc:
'''
from PIL import Image
import pytesseract

Image = Image.open('e.jpg')   # 打开图片
text = pytesseract.image_to_string(Image,lang='chi_sim')  #使用简体中文解析图片
print(text)

2.3 运行结果

 

posted on 2018-07-20 14:23  uniquefu  阅读(2742)  评论(0编辑  收藏  举报

导航