ubuntu tesseract 调试总结

1、下载、编译运行Leptonica

下载地址:http://code.google.com/p/leptonica/
版本号:1.69
包名:leptonica-1.69.tar.gz
依次输入命令./configure; make; make install安装(make uninstall clean 卸载)


2、下载、编译libtiff

下载地址:http://www.remotesensing.org/libtiff/
版本号:4.0.3
包名:tiff-4.0.3.tar.gz
依次输入命令 ./configure; sudo make ; sudo make install 安装

3、下载、编译tesseract

下载地址:http://code.google.com/p/tesseract-ocr/
版本号:3.02.02
包名:tesseract-ocr-3.02.02.tar.gz 
依次输入命令:./autogen.sh ; ./configure ; sudo make ; sudo make install
下载语言包:tesseract-ocr-3.02.eng.tar.gz 、tesseract-ocr-3.02.chi_sim.tar.gz
将语言包解压并且copy到/usr/local/share/tessdata/目录下
运行 tesseract *.tif outfile -l eng chi_sim 识别文字;

4、error调试

error日志:tesseract: error while loading shared libraries: libtiff.so.5:
原因:不存再libtiff.so.5 或者找不到
分析:因为前面已经安装了libtiff,故这里是找不到so文件。并且在/usr/local/lib 已经找到该so文件
解决方法:在/etc/ld.so.conf 文件中添加一行(即该so文件目录路径);并且执行命令/sbin/ldconfig –v更新。
参考链接:http://www.cnblogs.com/amboyna/archive/2008/02/06/1065322.html

 

posted @ 2013-01-22 16:23  lipeil  阅读(2643)  评论(0编辑  收藏  举报