提示:识别效果不是特别好
from PIL import Image
import pytesseract
import easygui
import os
# 选择文件对话框
path = easygui.fileopenbox()
print(path)
# 识别文字
text = pytesseract.image_to_string(Image.open(path), lang='chi_sim')
print(text)
具体安装步骤如下:
1.安装pytesseract、pillow库
pip install pytesseract
pip install pillow
2.安装Tesseract-OCR软件
安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。
3.在pytesseract模块中的pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,可以通过刚刚pip安装的位置找到pytesseract.py文件。
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步