利用语音识别和图像识别技术将视频转为图文并茂的文案

做在线教育的老师和视频自媒体的朋友经常会遇到过这样的烦恼：
1.录好了一节视频课程，学生看视频的时候也看明白了，但是想线下复习、理解，于是想找老师要视频文案。
2.想整理之前的视频内容，方便以后出书。
3.某个视频的金句或者图片挺好的，想用到自己的文案中。
等等。。。
HTWCore提供了这样的功能，可以将视频内容转换成图文并茂的文案：
1. 对于有字幕的视频，提取视频的字幕文本和关键帧，将视频字幕和对应的帧图片转成word文档。
2. 对于没有字幕的视频，通过语音识别视频内容并提取关键帧，将视频语音内容和对应的帧图片转成word文档。
这个功能的有用性在于：
一：文本加图片内容更丰富，并且人们更习惯于看图片，文档可读性强。
二：与视频相比文案更容易检索，对于做自媒体来说，我们需要某个视频的素材，把视频转成文案，里边文本和图片都有了。
三：视频文档化，在线课程等场景的视频可以转成文案，便于看完视频后复习、理解，并且容易联想到视频场景。并且对于老师以后整理出书等提供了图片和文字素材，极大地减少了工作量。
只需一个按键就能智能生成视频的字幕和图片，是不是很方便？欢迎大家使用。