javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别
javacv文字识别系列:
javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别
前言
本篇文章属于javacv系列的扩展篇。
在此之前我们已经通过javacv实现了流媒体这块的音视频编解码等等操作,当然还有图像处理。虽然使用opencv也可以实现文字识别,但是识别率不高,所以来试试google开源的tesserac ocr看看效果。
我们分为三步就可以做到实现:
首先,我们要添加依赖;次之,准备资源(需要训练好的语言包以及需要进行识别的图片,这里会提供最新的英文版下载以及中文简繁体下载地址);最后就开始编写代码。
废话少说,立刻开始吧。
1、添加依赖
(1)gradle方式
dependencies {
compile group: 'org.bytedeco', name: 'tesseract-platform', version: '4.1.1-1.5.3'
}
(2)maven方式
<dependency>
<groupId>org.bytedeco</groupId>
<artifactId>tesseract-platform</artifactId>
<version>4.1.1-1.5.3</version>
</dependency>
(3)jar包方式
javacv的包太大,这个不用讲了,建议用上面那两个。
2、下载语言包
英文和简体中文放在同一个压缩包中,免费下载,不要积分。
(1)英文版:https://download.csdn.net/download/eguid_1/12404120
(2)简体中文:https://download.csdn.net/download/eguid_1/12404120
(3)繁体中文:待上传
完整阅读本章:https://blog.csdn.net/eguid_1/article/details/106024626
---end---
本文来自博客园,作者:eguid,没有作者允许禁止转载,取得作者同意后转载需注明作者名和原文链接:https://www.cnblogs.com/eguid/p/12880407.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术