-
定义
- Tesseract是一个将图像翻译成文字的OCR库(光学文字识别,Optical Character Recognition)
-
安装
- sudo apt-get install tesseract-ocr
-
在python中调用Tesseract
- pip install pytesseract
- 在python代码中
import pytesseract
from PIL import Image
image = Image.open(jpg)
pytesseract.image_to_string(image)