合集-小样本利器

摘要:小样本利器5. 半监督集各家所长:MixMatch,MixText,UDA,FixMatch在前面章节中,我们介绍了几种半监督方案包括一致性正则,FGM对抗,最小熵原则,mixup增强。MixMatch则是集各家所长,把上述方案中的SOTA都融合在一起实现了1+1+1>3的效果。我们以MixMatch为基准,一并介绍几种衍生方案MixText,UDA,FixMatch 阅读全文
posted @ 2023-01-07 09:33 风雨中的小七 阅读(930) 评论(0) 推荐(0)
摘要:小样本利器4. 正则化+数据增强 Mixup Family代码实现这一章我们介绍嵌入模型的增强&正则化方案Mixup和Manifold Mixup,方法朴实无华,效果亲测有效~ 阅读全文
posted @ 2022-10-30 13:54 风雨中的小七 阅读(2060) 评论(0) 推荐(0)
摘要:小样本利器3. 半监督最小熵正则 MinEnt & PseudoLabel代码实现在前两章中我们已经聊过对抗学习FGM,一致性正则Temporal等方案,主要通过约束模型对细微的样本扰动给出一致性的预测,推动决策边界更加平滑。这一章我们主要针对低密度分离假设,聊聊如何使用未标注数据来推动决策边界向低密度区移动,相关代码实现详见[ClassicSolution/enhancement] 阅读全文
posted @ 2022-08-30 07:35 风雨中的小七 阅读(1323) 评论(0) 推荐(0)
摘要:小样本利器2.文本对抗+半监督 FGSM & VAT & FGM代码实现这一章我们结合FGSM,FGM,VAT看下如何使用对抗训练,以及对抗训练结合半监督来提升模型的鲁棒性。其中FGSM主要论述了对抗样本存在性和对抗训练提升模型鲁棒性的原因,VAT的两篇是对抗在CV领域应用的论文,而FGM是CV迁移到NLP的实现方案,一作都是同一位作者大大,在施工中的Simple Classification提供了FGM的tensorflow实现~ 阅读全文
posted @ 2022-06-28 21:24 风雨中的小七 阅读(1213) 评论(0) 推荐(0)
摘要:小样本利器1.半监督一致性正则 Temporal Ensemble & Mean Teacher代码实现这个系列我们用现实中经常碰到的小样本问题来串联半监督,文本对抗,文本增强等模型优化方案。小样本的核心在于如何在有限的标注样本上,最大化模型的泛化能力,让模型对unseen的样本拥有很好的预测效果。半监督通过利用大量的相同领域未标注数据来提升模型的样本外预测能力,这一章我们来聊聊半监督方案中的一致性正则。一致性正则~一个好的分类器应该对相似的样本点给出一致的预测,于是在训练中通过约束样本和注入噪声的样本要拥有相对一致的模型预测,来降低模型对局部扰动的敏感性,为模型参数拟合提供更多的约束。正在施工中的SimpleClassifcation提供了Temporal Ensemble的相关实现,可以支持多种预训练或者词袋模型作为backbone,欢迎来一起Debug~ 阅读全文
posted @ 2022-06-04 09:24 风雨中的小七 阅读(1698) 评论(0) 推荐(1)