负样本的理解
https://www.cnblogs.com/rainsoul/p/7890641.html
总结一下学习笔记
如,做一个汽车的照片分类,正样本 就是 正确的 汽车的图片,负样本就是 不是 汽车的图片。
通过模型训练,可以告诉机器,那些是对的,哪些是错误的。错误的就是负样本。
针对与分类问题,正样本则是我们想要正确分类出的类别所对应的样本,例如,我们要对一张图片进行分类,以确定其是否属于汽车,那么在训练的时候,汽车的图片则为正样本,负样本原则上可以选取任何不是汽车的其他图片,这样就可以训练出来一个汽车的分类网络,对这个网络进行测试会发现,它会将一些非汽车的图片误报成汽车,这些误报的图片则为“难分样本”,后续进行训练的时候,将这些难分样本加入至负样本集合中进行训练,最后得到的网络模效果会更好一些,这个过程就叫做“难例挖掘”。另外,在选取负样本的时候,原则上是可以选择任意非汽车的图片作为负样本,但是比较合理的情况应该是要考虑到实际应用场景,例如实际应用是对行车记录仪上面捕捉到的图片进行分类,那么,负样本则应该是捕捉到的其他非汽车的图片,例如马路,树木,路灯等。