摘要:
class torchvision.transforms.Compose(转换) 多个将transform组合起来使用。 class torchvision.transforms.CenterCrop(size) 将给定的PIL.Image进行中心切割,得到给定的size,size可以是tuple, 阅读全文
摘要:
所使用的是deeplab_model.tar.gz,也可以修改代码使用在标准数据集上预训练过的模型;代码在182行附近。 1.修改模型保存路径 2.修改图片路径 3.运行即可 参考自:https://www.aiuai.cn/aifarm252.html 阅读全文
摘要:
Deeplab v3+ 结构的精髓: 1.继续使用ASPP结构, SPP 利用对多种比例(rates)和多种有效感受野的不同分辨率特征处理,来挖掘多尺度的上下文内容信息. 解编码结构逐步重构空间信息来更好的捕捉物体边界. 2.添加新的解码模块,重构边界信息 3.尝试使用改进的xception模块(深 阅读全文
摘要:
Xception网络是由inception结构加上depthwise separable convlution,再加上残差网络结构改进而来/ 常规卷积是直接通过一个卷积核把空间信息和通道信息直接提取出来,结合了spatial dimensions和channels dimensions;xcepti 阅读全文
摘要:
采用多个小卷积核代替大卷积核,inception结构:使用两个 3x3 卷积核来代替 5x5 卷积,效果上差不多,但参数量减少很多,达到了优化的目的。不仅参数量少,层数也多了,深度也变深了; 还有分解版本的 3x3 = 3x1 + 1x3,这个效果在深度较深的情况下比规整的卷积核更好。 采用先降维后 阅读全文
摘要:
标准语义分割是指为每个像素分类,得到它的所属类;使用标准的PASCAL VOC IoU(intersection-over-union)得分来评估预测结果与真实场景之间的匹配准确度, 算法能够对图像中的每一个像素点进行准确的类别预测. 实例分割,是语义分割的子类型,同时对每个目标进行定位和语义分割, 阅读全文
摘要:
添加了解码模块来重构精确的图像物体边界。对比如图 deeplab v3+采用了与deeplab v3类似的多尺度带洞卷积结构ASPP,然后通过上采样,以及与不同卷积层相拼接,最终经过卷积以及上采样得到结果。 deeplab v3: 基于提出的编码-解码结构,可以任意通过控制 atrous convo 阅读全文
摘要:
全局平均池化与全连接对比 输出对比 全局平均池化就是把特征图全局平均一下输出一个值,也就是把W*H*D的一个张量变成1*1*D的张量。 常用的平均池化,平均池化会有它的filter size,比如 2 * 2,全局平均池化就没有size,它针对的是整张feature map. 例如:把一个100*1 阅读全文
摘要:
这个不是卷积中的步长stride 是另外一个含义, stride = 每个像素所占字节数 * width input stride为我们正常进行卷积时候设置的stride值,output stride为该矩阵经过多次卷积pooling操作后,尺寸缩小的值, 又叫做输入图片的分辨率与输出图片的分辨率的 阅读全文
摘要:
resnet残差网络模型结构的简单理解 一、提出 通常在深度学习中,越深的网络结构越能获得更具有代表性的特征,但是在网络层数加深的时候往往会出现梯度消失和梯度爆炸的问题, 问题主要是网路越深的时候变化量越小,梯度就逐渐消失,所以就提出学习残差来代替学习原始信号。 残差网络提出就是为了解决怎样在加深网 阅读全文