2020年11月26日
摘要: Transformer 是一类使用注意力机制(self-attention)加速运算的模型. 由 attention is all you need一文提出(google,NIPS,2017) transformer实现 1、基于encoder-decoder的架构。encoder和decoder均 阅读全文
posted @ 2020-11-26 11:19 zhongqing 阅读(313) 评论(0) 推荐(0) 编辑