使用Google开源tesseract OCR用语言库报allow_blob_division解决方案
在使用语音库时候 遇到报错:allow_blob_division,例如使用chi_sim.traineddata;
在chi_sim.traineddata文件目录下,使用命令行执行:
combine_tessdata -e chi_sim.traineddata chi_sim.config
执行完后,在目录下出现chi_sim.config的文件,打开该文件;
在allow_blob_division F这一行的前面加#,注释掉
即:# allow_blob_division F
然后,在执行命令行:
combine_tessdata -o chi_sim.traineddata chi_sim.config
到此在使用 chi_sim.traineddata文件就不会报read_params_file: parameter not found: allow_blob_division
当然,要使用上面的命令行,需要安装Tesseract-OCR