摘要:
简单的说,三步: 1. 为了处理一个batch里的数据,需要先做padding 2. 为了避免padding里[pad]对网络参数的影响,做pack [压缩] 3. 为了将结果传入下一步,做pad [解压] 基础说明:https://cloud.tencent.com/developer/artic 阅读全文
摘要:
from :https://zhuanlan.zhihu.com/p/28048246 seq2seq中的beam search算法过程 忆臻 哈尔滨工业大学 计算机科学与技术博士在读 188 人赞同了该文章 在sequence2sequence模型中,beam search的方法只用在测试的情 阅读全文