2019 年 3月 28 日随笔档案 - cup_leo

2019年3月28日

摘要： Transformer改进了RNN最被人诟病的训练慢的缺点，利用self-attention机制实现快速并行。它是由编码组件、解码组件和它们之间的连接组成。编码组件部分由一堆编码器（6个 encoder）构成。解码组件部分也是由相同数量（与编码器对应）的解码器（decoder）组成的。所有的编阅读全文

posted @ 2019-03-28 15:01 cup_leo 阅读(4218) 评论(0) 推荐(0) 编辑

cup_leo

公告