08 2020 档案
摘要:不同的坐标系 **世界坐标系:**目标物体位置的参考系。除了无穷远,世界坐标可以根据运算方便与否自由放置,单位为长度单位如,在双目视觉中世界坐标系主要有三个用途: 标定时确定标定物的位置; 作为双目视觉的系统参考系,给出两个摄像机相对世界坐标系的关系,从而求出相
阅读全文
摘要:参考自:https://zhuanlan.zhihu.com/p/53010734 Non-local Neural Networks及自注意力机制思考 创新 不管是cv还是NLP任务,都需要捕获长范围依赖。在时序任务中,RNN操作是一种主要的捕获长范围依赖手段,而在CNN中是通过堆叠多个卷积模块来
阅读全文
摘要:原代码链接 结果为: 经过一周的学习与参考其他同学的代码,我对自己的代码进行了一定的修改。 添加bn层 class HybridSN(nn.Module): def __init__(self, num_classes=16): super(HybridSN, self).__init__() se
阅读全文
摘要:Strip Pooling 语义分割既需要细节信息,又需要全局信息。 全局信息:Non-local modules、self-attention 存在的问题是需要计算很大的矩阵 其他的方法: 空洞卷积 全局平均/金字塔池化 只能获得各向同性的信息,很难获得各项异性的信息。 strip pooling
阅读全文
摘要:Res2Net 在自然场景中,视觉模式经常表现多尺寸特征。如下图所示,(1)一张图片中可能会存在不同尺寸的物体。比如,沙发及被子的大小是不同的。(2)一个物体自身的上下文信息可能会覆盖比自身更大范围的区域。比如,依赖于桌子的上下文信息,进而判断桌子上的黑色斑点是杯子还是笔筒。(3)不同尺寸的感知信息
阅读全文
摘要:参考自:https://blog.csdn.net/andyjkt/article/details/107662797 Squeeze-and-Excitation Networks 简介 Squeeze-and-Excitation Networks(SENet)是由自动驾驶公司Momenta
阅读全文
摘要:Deep Supervised Cross-modal Retrieval 摘要 在本文中提出了一种新颖的跨模式检索方法,称为深度监督跨模式检索(Deep Supervised Cross-modal Retrieval, DSCMR)。它旨在找到一个通用的表示空间,在其中可以直接比较来自不同模态的
阅读全文
摘要:参考自:https://www.jianshu.com/p/3687ffed4aa8 论文原文:https://arxiv.org/pdf/1608.03981.pdf 图像降噪 图像降噪,是最简单也是最基础的图像处理逆问题(inverse problem)。 降噪问题(这里只讨论additive
阅读全文
摘要:HybridSN 高光谱分类 Roy, G. Krishna, S. R. Dubey, B. B. Chaudhuri HybridSN: Exploring 3-D–2-D CNN Feature Hierarchy for Hyperspectral Image Classification,
阅读全文
摘要:参考自:https://blog.csdn.net/alxe_made/article/details/84424577 https://cloud.tencent.com/developer/article/1148375 Shortcut的一点思考 在完成第三周作业时看到老师的代码中有一段: #
阅读全文
摘要:头文件 import torch import torch.nn as nn import torch.nn.functional as F import torchvision import torchvision.transforms as transforms import matplotli
阅读全文
摘要:头文件: import torch import torch.nn as nn import torch.nn.functional as F import torchvision import torchvision.transforms as transforms import matplotl
阅读全文
摘要:源代码链接 import torch import torch.nn as nn from torch.hub import load_state_dict_from_url model_urls = { 'resnet18': 'https://download.pytorch.org/model
阅读全文
摘要:CIFAR10 数据集分类 对于视觉数据,PyTorch 创建了一个叫做 totchvision 的包,该包含有支持加载类似Imagenet,CIFAR10,MNIST 等公共数据集的数据加载模块 torchvision.datasets 和支持加载图像数据数据转换模块 torch.utils.da
阅读全文
摘要:卷积神经网络(CNN) 具体解释见文章 以下是代码实现: import torch import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torchvision import da
阅读全文
摘要:参考自: https://www.jianshu.com/p/f33e8f425d5b https://zhuanlan.zhihu.com/p/92134485 https://zhuanlan.zhihu.com/p/70703846 MobileNets Mobilenets是Google针对
阅读全文
摘要:原文:大话CNN经典模型 GoogLeNet 2014年,GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄,GoogLeNet获得了第一名、VGG获得了第二名,这两类模型结构的共同特点是层次更深了。 GoogLeNet做了更加大胆的网络结构尝试,虽然深度只有22层,但
阅读全文