javaCV文字识别之1：基于google的tesserac ocr识别图片中的文字，跨平台支持英文中文简体繁体等各种字符识别

javacv文字识别系列：

javaCV文字识别之1：基于google的tesserac ocr识别图片中的文字，跨平台支持英文中文简体繁体等各种字符识别

javaCV文字识别之2：视频文字识别和视频提取字幕文字字符

前言

本篇文章属于javacv系列的扩展篇。

在此之前我们已经通过javacv实现了流媒体这块的音视频编解码等等操作，当然还有图像处理。虽然使用opencv也可以实现文字识别，但是识别率不高，所以来试试google开源的tesserac ocr看看效果。

我们分为三步就可以做到实现：

首先，我们要添加依赖；次之，准备资源（需要训练好的语言包以及需要进行识别的图片，这里会提供最新的英文版下载以及中文简繁体下载地址）；最后就开始编写代码。

废话少说，立刻开始吧。

1、添加依赖

（1）gradle方式

dependencies {

compile group: 'org.bytedeco', name: 'tesseract-platform', version: '4.1.1-1.5.3'

}

（2）maven方式

<dependency>
           <groupId>org.bytedeco</groupId>
           <artifactId>tesseract-platform</artifactId>
           <version>4.1.1-1.5.3</version>
</dependency>

(3)jar包方式

javacv的包太大，这个不用讲了，建议用上面那两个。

2、下载语言包

英文和简体中文放在同一个压缩包中，免费下载，不要积分。

（1）英文版：https://download.csdn.net/download/eguid_1/12404120

（2）简体中文：https://download.csdn.net/download/eguid_1/12404120

（3）繁体中文：待上传

完整阅读本章：https://blog.csdn.net/eguid_1/article/details/106024626

---end---

posted @ 2020-05-13 09:27 eguid 阅读(1501) 评论(0) 收藏举报

刷新页面返回顶部

eguid

eguid创作和软件开发。每周分享自研工具软件，分享且不限于音视频、GIS等领域技术内容。

javaCV文字识别之1：基于google的tesserac ocr识别图片中的文字，跨平台支持英文中文简体繁体等各种字符识别

前言

1、添加依赖

2、下载语言包

公告