摘要: 在看RAM++模型的时候,看到了用的损失函数是asymmetric loss,称为非对称损失。以二分类问题为例,正类别和负类别的损失权重可以不相等。这样设计的目的是使模型更关注于对某一类别的正确分类,尤其是当某一类别的错误分类可能带来更严重后果时。 这个损失常常与focal loss一起做对比,"不 阅读全文
posted @ 2024-01-15 15:30 海_纳百川 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 图像理解数据集基于开源数据集进行构建,常用到的相关数据集有:COCO,VG(Visual Genome),SBU,CC, 既然涉及到图像理解,那每一个图片必定含有描述文本,而各个数据集是如何构建描述的呢? VG:(下载地址:https://orion.hyper.ai/tracker/downloa 阅读全文
posted @ 2024-01-15 08:55 海_纳百川 阅读(307) 评论(0) 推荐(0) 编辑
本站总访问量