Pascal voc api - roidb结构
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
<!--一个博主专栏付费入口结束-->
<link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
<link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
<div class="htmledit_views" id="content_views">
<p>roidb是由字典组成的list,每张图片对应一个字典,roidb[img_index]包含了该图片索引所包含的roi信息,下面以roidb[img_index]为例说明:</p>
box_num:一幅图片中所包含的box数量
class_num:分类所包含的种类数量
roidb[img_index]包含的key | value |
boxes | box位置信息,box_num*4的np.array |
gt_overlaps | 所有box在不同类别的得分,box_num*class_num的矩阵 |
gt_classes | 所有box的真实类别,box_num长度的list |
flipped | 是否翻转 |
image | 该图片的路径,字符串 |
width | 图片的宽 |
height | 图片的高 |
max_overlaps | 每个box在所有类别的得分最大值,即gt_overlaps行最大值,box_num长度 |
max_classes | 每个box的得分最高所对应的类,box_num长度 |
bbox_targets | 每个box的类别,以及与最接近的gt-box的4个方位偏移 |
参考: