摘要: 本篇总结神经机器翻译的实践中,较为基础的最佳实践。 应该使用哪个模型作为基线 Transformer是2017年发布的模型,即使到2020年仍然是比较好的基线模型,大热的BERT就是其升级版。 代码地址 Fairseq 这里实际推荐比较使用Fairseq指定arch为Transformer,按照官方 阅读全文
posted @ 2020-09-12 18:55 冬色 阅读(1245) 评论(0) 推荐(0) 编辑