2023 年 7月 26 日随笔档案 - 啊诚

2023年7月26日

论文翻译（扩散模型来了）：Diffusion-Based Mel-Spectrogram Enhancement for Personalized Speech Synthesis with Found Data

摘要：利用发现的数据来创建合成声音是具有挑战性的，因为现实世界的录音通常包含各种类型的音频退化。解决这个问题的一种方法是使用增强模型对语音进行预增强，然后使用增强后的数据进行文本转语音（TTS）模型训练。本论文研究了使用条件扩散模型进行广义语音增强，旨在同时解决多种类型的音频退化。增强是在对数Mel频谱领阅读全文

posted @ 2023-07-26 14:44 啊诚阅读(583) 评论(0) 推荐(0) 编辑

啊诚

公告