摘要: Whisper 是 OpenAI 近期开源的一个语音识别的模型,研究人员基于 680,000 小时的标记音频数据进行训练,它同时也是一个多任务模型,可以进行多语言语音识别以及语音翻译任务,可以将语音音频转录为所讲语言的文本,以及翻译成英语文本。 阅读全文
posted @ 2022-11-25 16:26 矩池云 阅读(792) 评论(0) 推荐(0) 编辑