1. 定义

    • Tesseract是一个将图像翻译成文字的OCR库(光学文字识别,Optical Character Recognition)
  2. 安装

    • sudo apt-get install tesseract-ocr
  3. 在python中调用Tesseract

    • pip install pytesseract
  • 在python代码中
    import pytesseract
    from PIL import Image
    image = Image.open(jpg)
    pytesseract.image_to_string(image)