随笔 - 165,  文章 - 0,  评论 - 4,  阅读 - 17887
05 2022 档案
MockingBird_代码与论文不同的细节
摘要:一.合成器 1.合成器的文本输入被处理成512维的character embedding,具体如下图所示: 2.建议参考B站视频:语音合成超简洁训练代码框架 二.GSTs 1.由于原Tacotron的encoder输出为256维度,与说话人编码器的输出speaker embedding(也是256维 阅读全文
posted @ 2022-05-26 23:39 孜孜不倦fly 阅读(190) 评论(0) 推荐(0) 编辑


< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示