javaCV文字识别之2:视频文字识别和视频提取字幕文字字符

javacv文字识别系列:

javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别

javaCV文字识别之2:视频文字识别和视频提取字幕文字字符

前言

上一章我们实现了图片的文字识别和提取,本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取

javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。

读取视频帧javacv已经帮我们封装好了,直接就可以读取到视频帧,麻烦的是,测试的时候发现javacv设置像素格式不起效果,所以我们只能通过BufferedImage进行转换后才能进行图片文字识别,性能上肯定会有折扣,后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给tesserac进行识别。

那么,就让我们开始吧。

注意:由于我们是每一帧都进行识别,而且视频播放和识别是相同线程,会阻塞,所以视频播放速度会很慢。

实现功能

1、视频读取

2、视频帧获取

3、视频帧转换为java的BuffredImage图片

4、图片转像素

5、使用像素数据进行tesserac ocr文字识别

 

完整阅读本章:https://eguid.blog.csdn.net/article/details/106044521

 

 

---end---

posted @   eguid  阅读(1831)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
点击右上角即可分享
微信分享提示