摘要: 在训练一个可以产生句子的网络时,有哪些技巧呢? Bad Attention 假如要做video的caption generation,某视频有4个frame,即有4个时刻的图片。 用$\alpha^i_t$表示attention weight,其上标表示frame的索引、下标表示时刻的索引。在第1个 阅读全文
posted @ 2021-05-22 10:06 臭咸鱼 阅读(120) 评论(0) 推荐(0) 编辑