2022 年 11月 25 日随笔档案 - 矩池云

摘要： Whisper 是 OpenAI 近期开源的一个语音识别的模型，研究人员基于 680,000 小时的标记音频数据进行训练，它同时也是一个多任务模型，可以进行多语言语音识别以及语音翻译任务，可以将语音音频转录为所讲语言的文本，以及翻译成英语文本。阅读全文

posted @ 2022-11-25 16:26 矩池云阅读(846) 评论(0) 推荐(0) 编辑

矩池云