摘要: Seq2seq Attention Normal Attention 1. 在decoder端,encoder state要进行一个线性变换,得到r1,可以用全连接,可以用conv,取决于自己,这里不需要加激活函数。 2. decoder端t时刻的输入和上一时刻的context vector(相当于 阅读全文
posted @ 2019-07-29 09:54 下路派出所 阅读(1552) 评论(0) 推荐(0) 编辑