OCR识别问题

我的OCR安装都没有问题,但是就是识别的时候返回空,并且没有任何错误。而且我将所有提供的语言都下载过。

翻过所有的博客最终发现可能是没有指定识别的语言

Tesseract各个版本语言包获取方式和安装方法
要在pytesseract 库的 image_to_string() 方法里加个参数lang='chi_sim',这个就是引用对应的中文语言包,中文语言包的全名是chi_sim.traineddata。

image = Image.open('English.png')
content = pytesseract.image_to_string(image, lang='chi_sim')   # 解析图片
print(content)

注释:中文  lang='chi_sim'

          英文 lang='eng'

posted @ 2020-03-14 17:36  太素元清  阅读(229)  评论(0编辑  收藏  举报