会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
啊诚
博客园
首页
新随笔
联系
订阅
管理
2023年7月26日
论文翻译(扩散模型来了):Diffusion-Based Mel-Spectrogram Enhancement for Personalized Speech Synthesis with Found Data
摘要: 利用发现的数据来创建合成声音是具有挑战性的,因为现实世界的录音通常包含各种类型的音频退化。解决这个问题的一种方法是使用增强模型对语音进行预增强,然后使用增强后的数据进行文本转语音(TTS)模型训练。本论文研究了使用条件扩散模型进行广义语音增强,旨在同时解决多种类型的音频退化。增强是在对数Mel频谱领
阅读全文
posted @ 2023-07-26 14:44 啊诚
阅读(583)
评论(0)
推荐(0)
编辑
公告