Tesseract OCR win 32位编译

https://github.com/tesseract-ocr/tesseract/wiki/Compiling

找到该标题:Develop Tesseract
按照上面的步骤执行即可,最后使用  vs2015 打开  sln 工程文件,编译。

编译过程中,会报一些错,把报错的文件编码格式更改 gbk 的即可。


然后下载数据文件
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
这里就下载英文和中文,
eng.traineddata
chi_sim.traineddata

使用命令行工具测试控制台程序是否运行正常

tesseract.exe 图片路径 结果保存路径 语言设置
例子:
tesseract.exe c:\img200W.jpg c:\result.txt -l eng+chi_sim
posted @ 2017-12-16 09:20  學海無涯  阅读(1045)  评论(0编辑  收藏  举报