python系列&deep_study系列：【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能...

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能...

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能.

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能.

有时候在看一些学习视频时候，难免感觉进度太慢，或者学习视频太枯燥，想自己根据视频关键信息做总结或快速浏览，想着如果有一个工具，我把视频丢进去，它自己给我生成里面语音的所有文本的信息，然后我自己根据文本来提炼关键的有用的信息，还可以节约看视频的时间，是不是会很Nice? 于是，前一天经过一位小伙伴的推荐，使用一款OpenAI开源的模型，也就是今天的主角——Whisper，来实现我们的上面这个偷懒的功能。

首先，去hugging face网上下载对应的模型，该模型分为几个不同的档次，可以根据自己的电脑配置要求来。例如，显卡显存、或者内存。如果使用CPU计算，可以使用内存，不过准确度会降低；如果使用显卡计算，就会提高很多准确度。同时，模型对显存需求越大，也代表精确越高。

模型下载地址：h