09 2020 档案
摘要:本文介绍近期出现的、具有代表性的,由声学特征重建语音波形的相关工作。将声学特征转换为语音波形的这类模型通常被称作声码器,一般来说,目前的端到端语音合成首先由声学模型生成声学特征,比如梅尔频谱、线性谱等,再由声码器转换为最终的语音。生成语音中的韵律、表现力等由声学模型决定,而清晰度则由声码器决定,声码
阅读全文
摘要:本篇总结神经机器翻译的实践中,较为基础的最佳实践。 应该使用哪个模型作为基线 Transformer是2017年发布的模型,即使到2020年仍然是比较好的基线模型,大热的BERT就是其升级版。 代码地址 Fairseq 这里实际推荐比较使用Fairseq指定arch为Transformer,按照官方
阅读全文
摘要:神经机器翻译(Neural Machine Translation,NMT)建立源语言到目标语言的映射。多语种神经机器翻译(Multilingual NMT)能够实现一个模型在多个语言之间映射。本篇主要介绍神经机器翻译,以及多语种神经机器翻译的最新研究进展。 Does Multi-Encoder H
阅读全文