Tesseract-OCR 的安装与使用

 


 

安装:

Windows:

1,下载安装包:点击下载

2,安装。安装过程中注意勾选所需语言包,否则默认只解析英文。

3,将根目录添加进环境变量。

4,cmd输入命令测试安装结果。

# 查看版本
tesseract -v

# 查看支持的语言列表
tesseract  --list-langs

 

Linux:

1,下载Tesseract-OCR源码包:点击下载

2,下载Leptonica源码包:点击下载

3,分别解压缩两个源码包,得到如下所示:

 4,安装依赖:

yum install -y autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

5,安装Leptonica:

cd leptonica-1.81.1
./configure --prefix=/usr/local/leptonica
make
make install

6,配置Leptonica环境变量:

vim /etc/profile
# 加入以下文本
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR
source /etc/profile

7,安装Tesseract-OCR:

cd tesseract-5.0.0-alpha-20210401/
./autogen.sh
./configure --prefix=/usr/local/tesseract
make
make install

8,配置Tesseract-OCR环境变量:

vim /etc/profile
# 加入以下文本
PATH=$PATH:/usr/local/tesseract/bin
export PATH
source /etc/profile

9,测试安装结果:

# 查看版本
tesseract -v

10,下载语言包:点击下载,并解压至share/tessdata。

11,检测支持语言:

# 查看支持的语言列表
tesseract  --list-langs

 


 

测试使用

# 使用简体中文+英文语言包,识别1.jpg并将内容输出至test.txt
tesseract 1.jpg test -l chi_sim+eng

测试图片:

 

 测试结果:

 

posted @ 2021-07-07 11:42  何效名  阅读(1094)  评论(0编辑  收藏  举报