摘要:
数据的输入几乎和Faster rcnn一样,标签格式xml是一样的。 相比Faster rcnn,数据多了一步处理,通过voc_annotation.py将图片路径和bbox+class存储在txt下样式如下: data\train/VOCdevkit/VOC2007\JPEGImages\0000 阅读全文
摘要:
假如一个bbox坐标为:[35 220 62 293 3] 第一步:将bbox转换为中心坐标和宽高形式(3种缩放比例进行缩放) 那么onehot:[0 0 0 1 0 0 0 0 0 0 ........],当然还可以平滑 计算bbox的中心坐标和宽高(35+62)/2 = 48.5 (220+29 阅读全文