摘要:
基于seq2seq文本生成的解码/采样策略 基于Seq2Seq模型的文本生成有各种不同的decoding strategy。文本生成中的decoding strategy主要可以分为两大类: Argmax Decoding: 主要包括beam search, class-factored softm 阅读全文
摘要:
NLP数据增强 1. UDA (Unsupervised Data Augmentation)【推荐】 一个半监督的学习方法,减少对标注数据的需求,增加对未标注数据的利用。 UDA使用的语言增强技术——Back-translation:回译能够在保存语义不变的情况下,生成多样的句式。 UDA关键解决 阅读全文
摘要:
Teacher forcing是什么? RNN 存在两种训练模式(mode): free-running mode: 上一个state的输出作为下一个state的输入。 teacher-forcing mode: 使用来自先验时间步长的输出作为输入。 teacher forcing要解决什么问题? 阅读全文