摘要: MaskGCT,AI语音克隆大模型本地部署(Windows11),基于Python3.11,TTS,文字转语音 前几天,又一款非自回归的文字转语音的AI模型:MaskGCT,开放了源码,和同样非自回归的F5-TTS模型一样,MaskGCT模型也是基于10万小时数据集Emilia训练而来的,精通中英日韩法德6种语言的跨语种合成。数据集Emilia是全球最大且最为多样的高质量多语种语音数据集之一。 本次分享一下如 阅读全文
posted @ 2024-10-28 17:31 刘悦的技术博客 阅读(1131) 评论(2) 推荐(0) 编辑