多维python切片,和yolo最后结构1,3,16,16,85的理解

多维python切片,和yolo最后结构1,3,16,16,85的理解

python切片操作中,...用于代替多个维度的:数字在左表示按行取,数字在右表示按列取。

prediction[:,:,:,:,:, 0] = prediction[..., 0]

按行取,第一个维度消失,按列取,最后一个维度消失。

yolo v3最后维度操作解释

总共是80个类别,需要化成85列,前4列是x,y,w,h.第5列是conf,往后第六列到85列是类别预测。

为什么每一列的结构都是1,3,16,16

> 这里每一列都代表一个值类型,所以这个代表bounding box个数是1x3x16x16个(这里3表示3个尺寸框),768个预测框每个框预测85个值。

posted @ 2020-03-15 16:43  vivia~  阅读(414)  评论(0编辑  收藏  举报