开源文字识别软件tesseract

1.下载4.0软件,下一步下一步到成功;

2.安装之后配置环境变量,Path中添加安装路径(默认:C:\Program Files (x86)\Tesseract-OCR)

3.新增语言库的环境变量,变量名:TESSDATA_PREFIX,变量值(默认:C:\Program Files (x86)\Tesseract-OCR\tessdata)

4.测试软件是否可用tesseract -v,能看到版本号就说明安装成功了

5.识别图片的文字(tesseract [in image]  [out txt[lange],如未指定语言,则默认为英文字体库识别

中文字体库识别:tesseract d:\1.png  result  -l chi_sim

英文字体库识别:tesseract d:\1.png result,

 

 

tesseract 4.0中文字库和安装软件(安装时自带英文字库)

 百度网盘:https://pan.baidu.com/s/1TiD2Tdez5JVbAhri8cumLA

密码:5mem

posted @ 2018-10-10 11:33  xiao贝  阅读(1065)  评论(0编辑  收藏  举报