一、整体流程介绍
二、数据准备
根据目标大小不同,考虑3种图像划分尺度,大中小;
而对锚框本身,有正、长、宽3种形态;
Po有无中心坐标(0、1)、Bx、By、Bw、Bh,这里是5个特征值,再加上COCO数据集本身自带的80个类别;
故对于每个图像块均构造一个对应的标签列向量y,(5+80)* 3 = 255;
C1、C2、C3是指分类类别;
13*13个图像块,共构造13*13个标签列向量 13*13*255。
二、神经网络结构
三、损失函数
指导优化神经网络权值
四、算法的整体设计