Arsene_W

2020年11月25日

Saliency-Guided Attention Network for Image-Sentence Matching

摘要：论文：Saliency-Guided Attention Network for Image-Sentence Matching 代码：Code 正如俗语所说“百闻不如一见”，相比与文本，图像往往隐含着更丰富的信息。作者认为，图像不仅能提供更有价值的细粒度信息，还能够完全保证其客观性。因此作者提出了阅读全文

posted @ 2020-11-25 19:24 Arsene_W 阅读(394) 评论(1) 推荐(0) 编辑

2020年11月22日

根据CSV文件生成ImageFolder格式数据集，并按比例划分训练集验证集

摘要：根据csv文件分类，生成ImageFolder格式数据集 import csv import shutil import os target_path = './train_split/' original_path = './train/' with open('train.csv', "rt", 阅读全文

posted @ 2020-11-22 16:41 Arsene_W 阅读(373) 评论(0) 推荐(0) 编辑

2020年11月18日

Context-Aware Multi-View Summarization Network for Image-Text Matching

摘要：论文：Context-Aware Multi-View Summarization Network for Image-Text Matching 代码：Code&Data 在图像与文本的跨模态中，通常面对着多视图的挑战，即对同一张图像，由于视角不同，可能会有多种文本描述。虽然有人尝试将多视图的信息阅读全文

posted @ 2020-11-18 19:46 Arsene_W 阅读(317) 评论(0) 推荐(0) 编辑

2020年11月15日

Classes Matter: A Fine-grained Adversarial Approach to Cross-domain Semantic Segmentation

摘要：论文：Classes Matter: A Fine-grained Adversarial Approach to Cross-domain Semantic Segmentation 代码：https://github.com/JDAI-CV/FADA 这篇论文主要思想是在语义分割领域通过对抗来实阅读全文

posted @ 2020-11-15 10:17 Arsene_W 阅读(422) 评论(0) 推荐(0) 编辑

2020年10月28日

GINet: Graph Interaction Network for Scene Parsing

摘要：论文：GINet: Graph Interaction Network for Scene Parsing 介绍目前来说，大部分语义分割的方法都是基于输入图像，也就是视觉特征进行分类，但这样就缺少了不同类别间的上下文相关性。 non-local可以通过计算不同像素之间的相关性来建立上下文关系，但计阅读全文

posted @ 2020-10-28 21:37 Arsene_W 阅读(507) 评论(0) 推荐(0) 编辑

2020年10月20日

Neural Multimodal Cooperative Learning Toward Micro-Video Understanding

摘要：论文：Neural Multimodal Cooperative Learning Toward Micro-Video Understanding 代码：Code & Data 介绍目前来说，对于跨模态的研究主要集中在对模态间共同的线索进行研究，即一致性。然而事实上除一致性外，互补性也同样重要。阅读全文

posted @ 2020-10-20 13:45 Arsene_W 阅读(361) 评论(4) 推荐(1) 编辑

2020年9月12日

GAN&cGAN&DCGAN

摘要： GAN GAN主要包括判别器（Discriminator）和生成器（Generator）。判别器用来区分真实样本和虚假样本。输入图片，输出图片是真实图片的概率。接收生成器的虚假样本G(z)和真实样本x。生成器通过随机噪声z生成虚假样本，欺骗判别器，使判别器D尽可能给出高的评分1。此时模型就变成阅读全文

posted @ 2020-09-12 15:10 Arsene_W 阅读(282) 评论(0) 推荐(0) 编辑

2020年8月22日

循环神经网络

摘要： RNN RNN便于处理具有时序关系的任务引入“记忆”概念基本结构输出不仅依赖于输入，还依赖于记忆将同一个结构循环利用两种输入，两种输出，一种函数三块参数： U：从输入到隐藏状态 W：从前一隐藏状态到下一隐藏状态 V：从隐藏状态到输出 xt：时间t处的输入 ht：时间t处的记忆，ht=f( 阅读全文

posted @ 2020-08-22 10:19 Arsene_W 阅读(147) 评论(0) 推荐(0) 编辑

2020年8月14日

HybridSN尝试加入SENet与dropout的一些坑

摘要：尝试在HybridSN 高光谱分类网络卷积层后加入SENet模块，代码如下： class SELayer(nn.Module): def __init__(self, channel, reduction=16): super(SELayer, self).__init__() self.avg_p 阅读全文

posted @ 2020-08-14 23:28 Arsene_W 阅读(910) 评论(0) 推荐(0) 编辑

2020年8月8日

代码练习&论文阅读

摘要：代码练习 nn.Conv2d的groups参数： groups参数控制分组卷积，参数默认为1，即普通二维卷积。当groups=1时： conv = nn.Conv2d(in_channels=6, out_channels=6, kernel_size=1, groups=1) conv.weig 阅读全文

posted @ 2020-08-08 14:02 Arsene_W 阅读(276) 评论(2) 推荐(0) 编辑

公告