卷积神经网络分类与回归任务的应用简介

location

  对输入图像定位,找到盒子坐标(x,y,w,h);Clssificaion and Location的最后一层是的特征做两件事,一个是分类,一个是定位。

         

  训练时使用已有的模型,也就是最后一层全联接之前所有的参数都用已有模型的,然后在这个基础上进行微调(fine tune),使其向着想要的网络去收敛。

               

  分类时,softmax计算loss,随机梯度下降SGD反向传播更新参数。测试时同时得到分类得分和定位(坐标)。

                  

  回归模块(regression head)放在什么位置呢?选择不同的卷积神经网络,回归模块放的位置也是不一样的。可以用于box坐标定位,也可以用于姿势识别、人脸识别。

      

  滑动窗口:实际要做scale变换,就是将图像缩小、放大,用同一个滑动窗口去检测。不同的神经网络对比(ResNet深度参差网络,层数越多Error越低)。

           

 

  

posted @   zarjen  阅读(2749)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示