javaCV文字识别之2：视频文字识别和视频提取字幕文字字符

javacv文字识别系列：

javaCV文字识别之1：基于google的tesserac ocr识别图片中的文字，跨平台支持英文中文简体繁体等各种字符识别

javaCV文字识别之2：视频文字识别和视频提取字幕文字字符

前言

上一章我们实现了图片的文字识别和提取，本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取

javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。

读取视频帧javacv已经帮我们封装好了，直接就可以读取到视频帧，麻烦的是，测试的时候发现javacv设置像素格式不起效果，所以我们只能通过BufferedImage进行转换后才能进行图片文字识别，性能上肯定会有折扣，后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给tesserac进行识别。

那么，就让我们开始吧。

注意：由于我们是每一帧都进行识别，而且视频播放和识别是相同线程，会阻塞，所以视频播放速度会很慢。

实现功能

1、视频读取

2、视频帧获取

3、视频帧转换为java的BuffredImage图片

4、图片转像素

5、使用像素数据进行tesserac ocr文字识别

完整阅读本章：https://eguid.blog.csdn.net/article/details/106044521

---end---

posted @ 2020-05-13 09:28 eguid 阅读(1924) 评论(0) 收藏举报

刷新页面返回顶部

eguid

eguid创作和软件开发。每周分享自研工具软件，分享且不限于音视频、GIS等领域技术内容。

javaCV文字识别之2：视频文字识别和视频提取字幕文字字符

前言

实现功能

公告