OCR识别问题

我的OCR安装都没有问题，但是就是识别的时候返回空，并且没有任何错误。而且我将所有提供的语言都下载过。

翻过所有的博客最终发现可能是没有指定识别的语言

Tesseract各个版本语言包获取方式和安装方法
要在pytesseract 库的 image_to_string() 方法里加个参数lang='chi_sim'，这个就是引用对应的中文语言包，中文语言包的全名是chi_sim.traineddata。

image = Image.open('English.png')
content = pytesseract.image_to_string(image, lang='chi_sim')   # 解析图片
print(content)

注释：中文 lang='chi_sim'

英文 lang='eng'

posted @ 2020-03-14 17:36 太素元清阅读(229) 评论(0) 编辑收藏举报

刷新页面返回顶部

太素元清