【Linux】- centos部署tesseract

安装相关依赖

sudo yum install autoconf automake  

sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

 

安装leptonica-1.72

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

tar -xvf leptonica-1.72.tar.gz

cd leptonica-1.72

执行配置指令 ./configure 

执行编译指令 make

执行安装指令 sudo make install 

至此,leptonica安装完毕

 

安装tesseract

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

如不能正常下载,可以网盘下载

https://pan.baidu.com/s/1mj6YTIw  

提取码是:95p5

解压指令 tar xzvf 3.04.00.tar.gz

cd tesseract-3.04.00

分别执行以下指令:

sudo ./autogen.sh

执行配置指令 ./configure

执行编译指令 make

执行安装指令 sudo make install 

执行指令 sudo ldconfig

 

这一步安装可能存在的问题较多,记录如下:

错误1:

缺少包,

执行指令:sudo yum install gcc-c++ 

然后在重新执行 ./configure

 

错误2:

make: Nothing to be done for `all' 

解决:

make clean 清除安装时留下的文件

在运行一下sudo ldconfig

在重新执行安装tesseract 步骤

 

错误3:

make[2]: Nothing to be done for `install-exec-am'.
make[2]: Nothing to be done for `install-data-am'.

解决:

make clean 清除安装时留下的文件

在运行一下sudo ldconfig

重新执行安装tesseract 步骤,其中./configure  改为./configure --prefix=/usr

 

错误4:

make[1]: *** [install-bfd] Error 2
make[1]: Leaving directory `/usr/local/gdb-7.10'

解决:

./configure --prefix=/usr/local/gdb #不要和gdb-version源码相同目录即可。

 

错误5:

ldconfig: Can't create temporary cache file /etc/ld.so.cache~: Permission denied

解决:

export LD_LIBRARY_PATH=/usr/local/lib

 

下载字体

下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
如不能下载,请参考上面网盘地址进行下载

将刚刚的文件拷贝到tessdata文件夹下:

sudo cp chi_sim.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata.part /usr/local/share/tessdata

 

测试

查看版本  tesseract --version

cd tesseract-3.04.00

cd testing

执行  tesseract phototest.tif result -l eng

 

再查看testing目录下的文件,发现多了一个result.txt:

打开 cat result.txt

 

 

参考:

1、https://blog.csdn.net/wanght89/article/details/78329546

2、https://blog.csdn.net/nsnv_hunter/article/details/79414752

3、https://blog.csdn.net/pangyunsheng/article/details/79372845

 

posted @ 2019-05-15 14:37  zheng1076  阅读(1149)  评论(0编辑  收藏  举报