Detectron-MaskRCnn:Mask判别和获取前向Mask的标签
对于FCN-SceneParse网络,最后卷积生成N个类别的maps,每个Map都得到图像所有点的单类概率。MaskRCNN的结构与FCN不相同。
参考三个文章:
Detectron总结1:Blob的生成 和 generate proposal
Detectron总结2:前向生成数据标签的过程
Detectron总结3:参数设置,直接打开cfg文件,找到train进行设置
Detectron总结4:Detectron测试流程(含Mask和KeyPoint)
获取多个Mask:
对于预测的二值掩膜输出,我们对每个像素点应用sigmoid函数,整体损失定义为平均二值交叉损失熵。 引入预测K个输出的机制,允许每个类都生成独立的掩膜,避免类间竞争。这样做解耦了掩膜和种类预测。不像是FCN的方法,在每个像素点上应用softmax函数,整体采用的多任务交叉熵,这样会导致类间竞争,最终导致分割效果差。
代码段:
获取每一个图像Mask
def getMaskImg( mask,box,image ): imageMask = image.copy(); for i in range(mask.shape[0]): for j in range(mask.shape[1]): if( mask[i,j]==0 ): #imageMask[i,j] = image[i,j] #mask[i,j] =254; imageMask[i,j,0]=0; imageMask[i,j,1]=0; imageMask[i,j,2]=0; x1 = int(box[0]); x2 = int(box[2]); y1 = int(box[1]); y2 = int(box[3]); imageMask = imageMask[y1:y2,x1:x2]; return imageMask;
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
2015-03-23 ML:自然语言处理NLP面试题
2015-03-23 CV/PR:模式识别与图像处理笔试题