Loading

Teacher Forcing

Teacher forcing 是一种序列任务中的技术。它最初提出的动机是使得RNN的训练得以并行,加快模型训练。
简单来说Teacher forcing就是将数据集中的标签作为模型输入。
首先,以RNN为例,介绍Teacher forcing的技术细节。下图为RNN展开的计算图。

如图所示,Teacher forcing在训练时和测试时使用不同的输入。
训练时,使用数据标签作为输入;测试时使用模型的输出作为输入。

但是,在open-loop 模式下,模型在训练时和测试的输入会有较大差异。缓解该问题有如下方法:
(1) 在训练时同时输入真实的数据值(teacher forcing inputs) 和 模型生成的值。
(2) 在训练师随机选择真实的数据值和模型生成的值。

参考: Deep learning

posted @ 2023-09-24 20:37  lif323  阅读(415)  评论(0编辑  收藏  举报