图片中的文字识别 python调用Tesseract
1.pip install pillow
2.pip install pytesseract
3.安装tesseract-ocr-setup-4.00.00dev.exe或者 tesseract-ocr-setup-3.05.01.exe(语言包安装时间很长,特别长,可以后续安装) 放在tessdata中,如下图
4.配置环境变量
5.运行出错(找不到语言包)操作如下
注意不要加 ;
如果你的环境变量是用作 路径相接,就不能有 ;
如果你的是和path类似的功能
这个看这个环境变量的用途
一般应该是路径相接
用环境变量部分代替每个机器上差异,用相对路径+环境变量来实现全路径
6.运行代码即可
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open(r'C:\Users\lenovo\Desktop\1.png'),lang='chi_sim')
print(text)