摘要:
在看RAM++模型的时候,看到了用的损失函数是asymmetric loss,称为非对称损失。以二分类问题为例,正类别和负类别的损失权重可以不相等。这样设计的目的是使模型更关注于对某一类别的正确分类,尤其是当某一类别的错误分类可能带来更严重后果时。 这个损失常常与focal loss一起做对比,"不 阅读全文
摘要:
图像理解数据集基于开源数据集进行构建,常用到的相关数据集有:COCO,VG(Visual Genome),SBU,CC, 既然涉及到图像理解,那每一个图片必定含有描述文本,而各个数据集是如何构建描述的呢? VG:(下载地址:https://orion.hyper.ai/tracker/downloa 阅读全文