CV 第十一课 Classification + Localization 中
Classification + Localization
有的时候我们不只想知道这张图上的object是猫(classification)
1. 我们还想知道猫在图中的哪个位置,并用框框住(Localization)
2. 我们还想知道一些固定的点,比如人的关节点的位置,这样可以预测人的姿势(Localization)
方法:
1. 框: 除了ImageNet分类时的输出 4096 ->1000,还增加了框的位置 4096 -> 4 (x,y,weight,height)
2. 固定节点: 增加了关节点的坐标 4096 -> 2 (x,y)
Loss:
对于同时有几个损失函数的优化,要将loss相加成LOSS 再一起优化 weight matrix