多维python切片,和yolo最后结构1,3,16,16,85的理解
多维python切片,和yolo最后结构1,3,16,16,85的理解
python切片操作中,...用于代替多个维度的:数字在左表示按行取,数字在右表示按列取。
prediction[:,:,:,:,:, 0] = prediction[..., 0]
按行取,第一个维度消失,按列取,最后一个维度消失。
yolo v3最后维度操作解释
总共是80个类别,需要化成85列,前4列是x,y,w,h.第5列是conf,往后第六列到85列是类别预测。
为什么每一列的结构都是1,3,16,16
> 这里每一列都代表一个值类型,所以这个代表bounding box个数是1x3x16x16个(这里3表示3个尺寸框),768个预测框每个框预测85个值。