【Linux】- centos部署tesseract
安装相关依赖
sudo yum install autoconf automake
sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
安装leptonica-1.72
wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xvf leptonica-1.72.tar.gz
cd leptonica-1.72
执行配置指令 ./configure
执行编译指令 make
执行安装指令 sudo make install
至此,leptonica安装完毕
安装tesseract
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
如不能正常下载,可以网盘下载
https://pan.baidu.com/s/1mj6YTIw
提取码是:95p5
解压指令 tar xzvf 3.04.00.tar.gz
cd tesseract-3.04.00
分别执行以下指令:
sudo ./autogen.sh
执行配置指令 ./configure
执行编译指令 make
执行安装指令 sudo make install
执行指令 sudo ldconfig
这一步安装可能存在的问题较多,记录如下:
错误1:
缺少包,
执行指令:sudo yum install gcc-c++
然后在重新执行 ./configure
错误2:
make: Nothing to be done for `all'
解决:
make clean 清除安装时留下的文件
在运行一下sudo ldconfig
在重新执行安装tesseract 步骤
错误3:
make[2]: Nothing to be done for `install-exec-am'.
make[2]: Nothing to be done for `install-data-am'.
解决:
make clean 清除安装时留下的文件
在运行一下sudo ldconfig
重新执行安装tesseract 步骤,其中./configure 改为./configure --prefix=/usr
错误4:
make[1]: *** [install-bfd] Error 2
make[1]: Leaving directory `/usr/local/gdb-7.10'
解决:
./configure --prefix=/usr/local/gdb #不要和gdb-version源码相同目录即可。
错误5:
ldconfig: Can't create temporary cache file /etc/ld.so.cache~: Permission denied
解决:
export LD_LIBRARY_PATH=/usr/local/lib
下载字体
下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
如不能下载,请参考上面网盘地址进行下载
将刚刚的文件拷贝到tessdata文件夹下:
sudo cp chi_sim.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata.part /usr/local/share/tessdata
测试
查看版本 tesseract --version
cd tesseract-3.04.00
cd testing
执行 tesseract phototest.tif result -l eng
再查看testing目录下的文件,发现多了一个result.txt:
打开 cat result.txt
参考:
1、https://blog.csdn.net/wanght89/article/details/78329546
2、https://blog.csdn.net/nsnv_hunter/article/details/79414752
3、https://blog.csdn.net/pangyunsheng/article/details/79372845