更新:2021.8.5
目前使用python3.7 (arcgis pro中),pytesseract 0.3.8
1、下载安装 Tesseract-OCR 5.0
https://pan.baidu.com/s/1qXumxdltxOnb0geaE_1U-Q
安装时候用中文语言下载,勾选上。
2、pip install pytesseract
这步骤可能失效,就到pip网站下载gz文件,解压,放到,都可以
C:\Program Files\ArcGIS\Pro\bin\Python
然后使用 python setup.py install安装
就可以使用了
import pytesseract from PIL import Image im_en = Image.open('short-null.png') num1 = Image.open('num1.png') im_ch = Image.open('Chinese2.png') print('========识别字母========') ret=pytesseract.image_to_string(num1) if ret!=None and ret!='': print(ret.strip().replace(' ','.')) else: print('null') # print('========识别中文========') # print(pytesseract.image_to_string(im_ch, lang='chi_sim'))
# -*- coding: utf-8 -*- import cv2 import numpy as np import pytesseract path=ur'D:\code-arcpy\cccpyautogui\number.png' img = cv2.imread(path) cv2.namedWindow("input image",cv2.WINDOW_AUTOSIZE) cv2.imshow("input image",img) cv2.waitKey(0) cv2.destroyAllWindows() text = pytesseract.image_to_string(img, lang='chi_sim') print(text)
都使用的 python2 setup.py install安装,注意版本,过高的版本也会有异常
上图是用的pytesseract-0.2.2.tar 报错,换了 pytesseract-0.2.0.tar.gz正常。
https://pypi.org/project/pytesseract/0.2.0/#description
tesseract-ocr安装:
https://pan.baidu.com/s/1OL0g1MBzeijD23JN0UGC0Q
注意最后要把语言包放在
opencv安装见另一篇。