OCR识别问题
我的OCR安装都没有问题,但是就是识别的时候返回空,并且没有任何错误。而且我将所有提供的语言都下载过。
翻过所有的博客最终发现可能是没有指定识别的语言
Tesseract各个版本语言包获取方式和安装方法
要在pytesseract 库的 image_to_string() 方法里加个参数lang='chi_sim'
,这个就是引用对应的中文语言包,中文语言包的全名是chi_sim.traineddata。
image = Image.open('English.png') content = pytesseract.image_to_string(image, lang='chi_sim') # 解析图片 print(content)
注释:中文 lang='chi_sim'
英文 lang='eng'