RapidVideOCR:视频硬字幕提取


简体中文 | English

PyPI SemVer2.0

目录

简介

  • 视频硬字幕提取,自动生成对应srt | txt文件。
  • 支持字幕语言:中文 | 英文 (其他可以支持的语言参见:支持语种列表)
  • 可加入QQ群:706807542
  • 更快更准确地提取视频硬字幕,并提供srt| txtl两种格式的输出:
    • 更快:与VideoSubFinder软件结合使用,提取关键字幕帧更快。
    • 更准:采用RapidOCR作为识别库。
    • 更方便:pip直接安装即可使用。
  • 该工具处于发展中。在使用过程中,如果遇到任何问题,欢迎提issue或者入群反馈。
  • 如果不愿意用的话,不用就好,不要影响自己心情。
  • 如果有帮助到您的话,请给个小星星⭐或者赞助一杯咖啡(点击页面最上面的Sponser中链接)。

TODO

整体框架

flowchart LR A(VideoSubFinder) --提取字幕关键帧--> B(RapidVideOCR) --OCR--> C(SRT)

使用步骤

  1. 安装使用VideoSubFinder软件
  2. 安装rapid_videocr
    pip install rapid_videocr
    
  3. 使用RapidVideOCR工具
    • 脚本运行:
      from rapid_videocr import RapidVideOCR
      
      # RapidVideOCR有两个初始化参数
      # is_concat_rec: 是否用单张图识别,默认是False,也就是默认用单图识别
      # concat_batch: 叠图识别的图像张数,默认10,可自行调节
      extractor = RapidVideOCR()
      
      rgb_dir = 'test_files/TXTImages'
      save_dir = 'result'
      extractor(rgb_dir, save_dir)
      
    • 命令行运行:
      • Usage:
        $ rapid_videocr -h
        usage: rapid_videocr [-h] [-i IMG_DIR] [-s SAVE_DIR] [-o {srt,txt,all}]
                           [-m {single,concat}]
        
        optional arguments:
        -h, --help            show this help message and exit
        -i IMG_DIR, --img_dir IMG_DIR
                               The full path of RGBImages or TXTImages.
        -s SAVE_DIR, --save_dir SAVE_DIR
                               The path of saving the recognition result.
        -o {srt,txt,all}, --out_format {srt,txt,all}
                               Output file format. Default is "all"
        -m {single,concat}, --mode {single,concat}
                               Which mode to run (concat recognition or single
                               recognition), default is "single"
        -b CONCAT_BATCH, --concat_batch CONCAT_BATCH
                               The batch of concating image nums in concat
                               recognition mode. Default is 10.
        
      • Example:
        $ rapid_videocr -i RGBImages -s Results -o srt -m concat -b 10
        
  4. 查看结果
    • 前往save_dir目录下即可查看结果。
    • 值得注意的是,如果想要让视频播放软件自动挂载srt文件,需要更改srt文件名字为视频文件名字,且放到同一目录下,亦或者手动指定加载。

更新日志(more

  • 😀2023-03-14 v2.1.3 update:

    • 修复输入TXTImages目录且叠字识别时错误
  • 😜2023-03-12 v2.1.2 update:

    • 修复索引错误,#22

写在最后

  • 扫码加入组织:
posted @ 2022-12-17 20:06  Danno  阅读(535)  评论(0编辑  收藏  举报