摘要: 一、Attention 1.基本信息 最先出自于Bengio团队一篇论文:NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE ,论文在2015年发表在ICLR。 encoder-decoder模型通常的做法是将一 阅读全文
posted @ 2019-12-10 22:09 suwenyuan 阅读(2149) 评论(0) 推荐(0) 编辑
摘要: pack_padded_sequence是将句子按照batch优先的原则记录每个句子的词,变化为不定长tensor,方便计算损失函数。 pad_packed_sequence是将pack_padded_sequence生成的结构转化为原先的结构,定长的tensor。 其中test.txt的内容 As 阅读全文
posted @ 2019-12-10 10:31 suwenyuan 阅读(2587) 评论(0) 推荐(0) 编辑