摘要: 论文地址:https://arxiv.org/pdf/2001.09977.pdf 模型 Meena的seq2seq模型是基于Evolved Transformer来搭建的。 Transformer包含一个Encoder和一个Decoder,每个Encoder由若干个结构相同的Encoder-blo 阅读全文
posted @ 2021-05-14 20:10 _yanghh 阅读(258) 评论(0) 推荐(1) 编辑
摘要: 论文地址:https://arxiv.org/pdf/2004.13637.pdf 模型 这篇论文提出了3个模型。 1. 检索模型(Retriever) 就是从候选集中选取最合适的句子作为机器人当前的答复,训练时,候选集只有给定的一句response; 在做推断时,候选集由训练集中的所有respon 阅读全文
posted @ 2021-05-14 20:01 _yanghh 阅读(753) 评论(0) 推荐(1) 编辑