随笔分类 -  A-image segmentation

摘要:多尺度检测(不同的idea) (特征金字塔)(空间金字塔池化)(带洞空间金字塔池化)(融合深浅层特征) 检测和分割中的例子 分割: sppnet中的spp空间金字塔池化结构;(spatial pyramid pooling) pspnet中的pyramid pooling moudle结构,综合讲是 阅读全文
posted @ 2019-06-14 12:19 you-wh 阅读(9340) 评论(3) 推荐(2) 编辑
摘要:将训练好的语义分割模型保存下来,重新加载之后 通过这一个操作得到标签; 绘图的主函数在下面: 阅读全文
posted @ 2019-04-15 15:58 you-wh 阅读(2564) 评论(0) 推荐(0) 编辑
摘要:该模块融合了4种不同金字塔尺度的特征,第一行红色是最粗糙的特征–全局池化生成单个bin输出,后面三行是不同尺度的池化特征。 为了保证全局特征的权重,如果金字塔共有N个级别,则在每个级别后使用1×1 1×11×1的卷积将对于级别通道降为原本的1/N。再通过双线性插值获得未池化前的大小,最终concat 阅读全文
posted @ 2019-04-14 11:01 you-wh 阅读(6795) 评论(4) 推荐(4) 编辑
摘要:空间金字塔池化技术, 厉害之处,在于使得我们构建的网络,可以输入任意大小的图片,不需要经过裁剪缩放等操作。 是后续许多金字塔技术(psp,aspp等)的起源,主要的目的都是为了获取场景语境信息,获取上下文的联系。 如图所示,对于选择的不同大小的区域对应到卷积之后的特征图上,得到的也是大小不一致的特征 阅读全文
posted @ 2019-04-04 16:26 you-wh 阅读(4922) 评论(0) 推荐(2) 编辑
摘要:加入带洞卷积的resnet结构的构建,以及普通resnet如何通过模块的组合来堆砌深层卷积网络。 第一段代码为deeplab v3+(pytorch版本)中的基本模型改进版resnet的构建过程, 第二段代码为model的全部结构图示,以文字的方式表示,forward过程并未显示其中 打印出的mod 阅读全文
posted @ 2019-03-27 16:57 you-wh 阅读(2726) 评论(0) 推荐(0) 编辑
摘要:所使用的是deeplab_model.tar.gz,也可以修改代码使用在标准数据集上预训练过的模型;代码在182行附近。 1.修改模型保存路径 2.修改图片路径 3.运行即可 参考自:https://www.aiuai.cn/aifarm252.html 阅读全文
posted @ 2019-03-16 12:42 you-wh 阅读(4116) 评论(0) 推荐(0) 编辑
摘要:标准语义分割是指为每个像素分类,得到它的所属类;使用标准的PASCAL VOC IoU(intersection-over-union)得分来评估预测结果与真实场景之间的匹配准确度, 算法能够对图像中的每一个像素点进行准确的类别预测. 实例分割,是语义分割的子类型,同时对每个目标进行定位和语义分割, 阅读全文
posted @ 2019-03-05 20:17 you-wh 阅读(5850) 评论(0) 推荐(1) 编辑
摘要:添加了解码模块来重构精确的图像物体边界。对比如图 deeplab v3+采用了与deeplab v3类似的多尺度带洞卷积结构ASPP,然后通过上采样,以及与不同卷积层相拼接,最终经过卷积以及上采样得到结果。 deeplab v3: 基于提出的编码-解码结构,可以任意通过控制 atrous convo 阅读全文
posted @ 2019-03-05 19:27 you-wh 阅读(8380) 评论(0) 推荐(0) 编辑
摘要:这个不是卷积中的步长stride 是另外一个含义, stride = 每个像素所占字节数 * width input stride为我们正常进行卷积时候设置的stride值,output stride为该矩阵经过多次卷积pooling操作后,尺寸缩小的值, 又叫做输入图片的分辨率与输出图片的分辨率的 阅读全文
posted @ 2019-03-05 14:40 you-wh 阅读(2632) 评论(0) 推荐(0) 编辑
摘要:基于深度学习的图像分割的方法的一般套路: 1.下采样 + 上采样,卷积池化转置卷积; 2.多尺度特征拼接,低维度特征结合高维度特征; 3.获得像素级别的segement map,即对每个像素进行分类。 在做反卷积上采样的时候,往往通过拼接融合的方法得到更多的信息,拼接的方法有 语义分割网络在特征融合 阅读全文
posted @ 2019-02-28 21:39 you-wh 阅读(644) 评论(0) 推荐(0) 编辑
摘要:U-net网络主要思路是源于FCN,采用全卷积网络,对图像进行逐像素分类,能在图像分割领域达到不错的效果。 因其网络结构类似于U型,所以以此命名,可以由其架构清晰的看出,其构成是由左端的卷积压缩层,以及右端的转置卷积放大层组成; 左右两端之间还有联系,通过灰色箭头所指,右端在进行转置卷积操作的时候, 阅读全文
posted @ 2019-02-28 10:58 you-wh 阅读(11254) 评论(7) 推荐(1) 编辑
摘要:语义分割的基本结构如下,通过一个分割模型确定基本结果,再通过CRF等进行优化输出。 后面优化的模型有以下几种: 全连接条件随机场(DenseCRF) CRFasRNN 马尔科夫随机场(MRF) 高斯条件随机场(G-CRF) 后面的概率模型中存在二元势函数, 二元势函数就是描述像素点与像素点之间的关系 阅读全文
posted @ 2019-02-26 16:38 you-wh 阅读(1176) 评论(0) 推荐(0) 编辑
摘要:FCN在之前做过介绍 下面是几种对称结构,基本上都是基于编码和解码的过程,主要使用了卷积和反卷积,池化,上采样的结构。 上采样的实现主要在于池化时记住输出值的位置,在上池化时再将这个值填回原来的位置,其他位置填0。 SegNet DeconvNet 下面是一种稍微成熟的结构,称为带洞卷积结构。 De 阅读全文
posted @ 2019-02-26 15:31 you-wh 阅读(1096) 评论(0) 推荐(0) 编辑
摘要:FCN特点 1.卷积化 即是将普通的分类网络丢弃全连接层,换上对应的卷积层即可 2.上采样 方法是双线性上采样差 此处的上采样即是反卷积3.因为如果将全卷积之后的结果直接上采样得到的结果是很粗糙的,所以作者将不同池化层的结果进行上采样之后来优化输出 3.跳跃结构: 现在我们有1/32尺寸的heatM 阅读全文
posted @ 2018-12-21 18:11 you-wh 阅读(6563) 评论(0) 推荐(0) 编辑

Fork me on GitHub
点击右上角即可分享
微信分享提示