摘要: 模型介绍 SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测 多语言识别: 采用超过40万小时数据训练,支持超过50种语言,识别效果上优于Whisper模型。 富文本识别: 具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。 支持声音事件检测能力,支持音乐 阅读全文
posted @ 2024-09-04 23:30 贾维斯Echo 阅读(1593) 评论(0) 推荐(1) 编辑