摘要: 数据的输入几乎和Faster rcnn一样,标签格式xml是一样的。 相比Faster rcnn,数据多了一步处理,通过voc_annotation.py将图片路径和bbox+class存储在txt下样式如下: data\train/VOCdevkit/VOC2007\JPEGImages\0000 阅读全文
posted @ 2020-01-10 16:13 奥布莱恩 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 假如一个bbox坐标为:[35 220 62 293 3] 第一步:将bbox转换为中心坐标和宽高形式(3种缩放比例进行缩放) 那么onehot:[0 0 0 1 0 0 0 0 0 0 ........],当然还可以平滑 计算bbox的中心坐标和宽高(35+62)/2 = 48.5 (220+29 阅读全文
posted @ 2020-01-10 14:58 奥布莱恩 阅读(1957) 评论(0) 推荐(0) 编辑