【新技术】语音到语音翻译 Speech-to-speech translation for a real-world unwritten language
概览
李宏毅讲解
Meta 博客
论文:Speech-to-speech translation for a real-world unwritten language
原始题目 | Speech-to-speech translation for a real-world unwritten language |
---|---|
中文名称 | 现实世界 没有文字语言 的语音对语音翻译 |
发表时间 | 2022年 10 月 19日 |
平台 | |
来源 | Meta AI |
文章链接 | https://scontent-nrt1-1.xx.fbcdn.net/v/t39.8562-6/309184257_1075902092944168_6340948942681513778_n.pdf?_nc_cat=105&ccb=1-7&_nc_sid=ad8a9d&_nc_ohc=yWQxeJKcDRcAX-Cdd5I&_nc_ht=scontent-nrt1-1.xx&oh=00_AfBATXeX7wiM1DJAMZ7AfYPqb3BuZ-L5fBFVPDEwkCUv7g&oe=63709E76 |
开源代码 | |
系统演示 | https://huggingface.co/spaces/facebook/Hokkien_Translation |
自监督学习 开始卷向 语音领域了。很新颖的观点,未来可期。
还有许多工作可以做。这可能是自监督学习在语音领域应用的开端。像情感、说话人对应等等有待探索。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现