ablation baselines. (消融基线)的理解

参考自原文链接
目的其实就是为了控制变量。

比如说你为了提升baseline的性能,给它加了两个模块A,B,加完之后效果果然提高了很多。于是你急急忙忙开始写论文,写到你的贡献,你给了两条:1.模块A,2.模块B。

但是这样写有个问题:尽管AB同时加上去对模型有提升效果,但是你并没有证明A、B两个模块分别都是有意义的。

所以为了验证A、B两个模块是不是真的都有用,你需要做ablation study。方法也很简单:

在baseline的基础上加上模块A,看效果。
在baseline的基础上加上模块B,看效果。
在baseline的基础上同时加上模块AB,看效果。
然后结果可能是,实验1和实验2的结果都不如实验3,那么说明AB都是有用的;然而也有可能你会发现实验1的结果和实验3一样,甚至更好。这就说明你的想法是有问题的,模块B其实并没有起到作用,提升只来自于模块A。

posted @ 2021-11-11 10:50  xingye_z  阅读(210)  评论(0编辑  收藏  举报