摘要: Transformer 本文介绍了 Transformer 结构, 是一种 encoder decoder , 用来处理序列问题, 常用在NLP相关问题中. 与传统的专门处理序列问题的encoder decoder相比, 有以下的特点: 结构完全 不依赖于CNN和RNN 完全依赖于 self att 阅读全文
posted @ 2018-12-23 15:28 gart 阅读(3979) 评论(1) 推荐(0) 编辑