RapidVideOCR:视频硬字幕提取
简体中文 | English
简介
- 视频硬字幕提取,自动生成对应
srt | txt
文件。 - 支持字幕语言:中文 | 英文 (其他可以支持的语言参见:支持语种列表)
- 可加入QQ群:706807542
- 更快更准确地提取视频硬字幕,并提供
srt| txt
l两种格式的输出:- 更快:与VideoSubFinder软件结合使用,提取关键字幕帧更快。
- 更准:采用RapidOCR作为识别库。
- 更方便:pip直接安装即可使用。
- 该工具处于发展中。在使用过程中,如果遇到任何问题,欢迎提issue或者入群反馈。
- 如果不愿意用的话,不用就好,不要影响自己心情。
- 如果有帮助到您的话,请给个小星星⭐或者赞助一杯咖啡(点击页面最上面的Sponser中链接)。
TODO
整体框架
flowchart LR
A(VideoSubFinder) --提取字幕关键帧--> B(RapidVideOCR) --OCR--> C(SRT)
使用步骤
- 安装使用VideoSubFinder软件
- 下载地址:videosubfinder / QQ群(706807542)共享文件
- 使用教程:VideoSubFinder提取字幕关键帧教程
- 最终生成的
RGBImages
和TXTImages
目录一般会在软件安装目录下 - ✧ 推荐用
RGBImages
目录中图像(感谢小伙伴dyphire在#21的反馈)
- 安装rapid_videocr
pip install rapid_videocr
- 使用RapidVideOCR工具
- 脚本运行:
from rapid_videocr import RapidVideOCR # RapidVideOCR有两个初始化参数 # is_concat_rec: 是否用单张图识别,默认是False,也就是默认用单图识别 # concat_batch: 叠图识别的图像张数,默认10,可自行调节 extractor = RapidVideOCR() rgb_dir = 'test_files/TXTImages' save_dir = 'result' extractor(rgb_dir, save_dir)
- 命令行运行:
- Usage:
$ rapid_videocr -h usage: rapid_videocr [-h] [-i IMG_DIR] [-s SAVE_DIR] [-o {srt,txt,all}] [-m {single,concat}] optional arguments: -h, --help show this help message and exit -i IMG_DIR, --img_dir IMG_DIR The full path of RGBImages or TXTImages. -s SAVE_DIR, --save_dir SAVE_DIR The path of saving the recognition result. -o {srt,txt,all}, --out_format {srt,txt,all} Output file format. Default is "all" -m {single,concat}, --mode {single,concat} Which mode to run (concat recognition or single recognition), default is "single" -b CONCAT_BATCH, --concat_batch CONCAT_BATCH The batch of concating image nums in concat recognition mode. Default is 10.
- Example:
$ rapid_videocr -i RGBImages -s Results -o srt -m concat -b 10
- Usage:
- 脚本运行:
- 查看结果
- 前往
save_dir
目录下即可查看结果。 - 值得注意的是,如果想要让视频播放软件自动挂载srt文件,需要更改srt文件名字为视频文件名字,且放到同一目录下,亦或者手动指定加载。
- 前往
更新日志(more)
-
😀2023-03-14 v2.1.3 update:
- 修复输入
TXTImages
目录且叠字识别时错误
- 修复输入
-
😜2023-03-12 v2.1.2 update:
- 修复索引错误,#22
写在最后
- 扫码加入组织:
-----------------------------------------
你驻足于春色中,于那独一无二的春色之中。