论文推介 - 随笔分类 - 高峰OUC

【ACMMM2024】Multi-Scale and Detail-Enhanced Segment Anything Model for Salient Object Detection

摘要：论文：https://arxiv.org/pdf/2408.04326 代码：https://github.com/BellyBeauty/MDSAM 论文的研究动机就是使用SAM来解决显著性检测（SOD）问题，主要有两个改进：提出了Lightweight Multi-Scale Adapter, 阅读全文

posted @ 2024-08-28 13:16 高峰OUC 阅读(113) 评论(0) 推荐(0) 编辑

【CVPR2023】Efficient and Explicit Modelling of Image Hierarchies for Image Restoration

摘要：> 论文：https://readpaper.com/paper/4728855966703960065 代码：https://github.com/ofsoundof/GRL-Image-Restoration 这个论文的代码地址叫GRL，意思是 Global, Regional, Local 的阅读全文

posted @ 2023-10-31 16:21 高峰OUC 阅读(230) 评论(0) 推荐(0) 编辑

【CVPR2023】Learning A Sparse Transformer Network for Effective Image Deraining

摘要：论文：https://readpaper.com/paper/4736105248993591297 代码：https://github.com/cschenxiang/DRSformer Transformer 模型通常使用标准的 QKV 三件套进行计算，但是部分来自 K 的 token 与来自阅读全文

posted @ 2023-10-31 10:21 高峰OUC 阅读(358) 评论(0) 推荐(0) 编辑

【AAAI2023】Ultra-High-Definition Low-Light Image Enhancement

摘要：【AAAI2023】Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and Transformer-Based Method 代码：https://github.com/TaoWangzj/LLFormer 这个论文首先构阅读全文

posted @ 2023-01-31 00:41 高峰OUC 阅读(452) 评论(0) 推荐(0) 编辑

【TPAMI2023】Global Learnable Attention for Single Image Super-Resolution

摘要：【TPAMI2023】Global Learnable Attention for Single Image Super-Resolution 代码：https://github.com/laoyangui/DLSN 这是来自福州大学的工作，提出一个有意思的观点：当前方法大多使用 non-local 阅读全文

posted @ 2023-01-26 22:37 高峰OUC 阅读(238) 评论(0) 推荐(0) 编辑

【AAAI2023】Head-Free Lightweight Semantic Segmentation with Linear Transformer

摘要：论文：【AAAI2023】Head-Free Lightweight Semantic Segmentation with Linear Transformer 代码：https://github.com/dongbo811/AFFormer 这是来自阿里巴巴的工作，作者构建了一个轻量级的Trans 阅读全文

posted @ 2023-01-26 17:05 高峰OUC 阅读(391) 评论(0) 推荐(0) 编辑

【ARIXV2209】Multi-Scale Attention Network for Single Image Super-Resolution

摘要：【ARIXV2209】Multi-Scale Attention Network for Single Image Super-Resolution 代码：https://github.com/icandle/MAN 这是来自南开大学的工作，将多尺度机制与大核注意机制结合，用于图像超分辨率。 202 阅读全文

posted @ 2023-01-24 21:58 高峰OUC 阅读(372) 评论(0) 推荐(0) 编辑

【NeurIPS2022】Cross Aggregation Transformer for Image Restoration

摘要：【NeurIPS2022】Cross Aggregation Transformer for Image Restoration **研究动机：**当前方法 Transformer 方法把图像分成8x8的小块处理，the square window lacks inter-window intera 阅读全文

posted @ 2022-12-07 20:30 高峰OUC 阅读(167) 评论(0) 推荐(0) 编辑

【ARXIV2211】Efficient multi-order gated aggregation network

摘要：作者认为，交互复杂性是视觉识别一个重要特点。为此，作者通过复杂特征交互构建了一个纯卷积的网络 MogaNet 用于图像识别。MogaNet的整体框架如下图所示，架构和一般的 Transformer 网络非常类似，核心包括两个模块：spatial aggregation （取代注意力）和 chann 阅读全文

posted @ 2022-12-07 15:09 高峰OUC 阅读(160) 评论(0) 推荐(0) 编辑

【CVPR2022】Detecting Camouﬂaged Object in Frequency Domain

摘要：【CVPR2022】Detecting Camouﬂaged Object in Frequency Domain 论文有一个非官方的实现：https://github.com/VisibleShadow/Implementation-of-Detecting-Camouflaged-Object- 阅读全文

posted @ 2022-12-04 11:36 高峰OUC 阅读(339) 评论(0) 推荐(0) 编辑

【NeurIPS2022】ScalableViT: Rethinking the Context-oriented Generalization of Vision Transformer

摘要：【NeurIPS2022】ScalableViT: Rethinking the Context-oriented Generalization of Vision Transformer 这篇论文来自清华大学深圳研究生院和字节跳动。从Swin开始，attention一般都包括局部 window 阅读全文

posted @ 2022-12-03 21:34 高峰OUC 阅读(70) 评论(0) 推荐(0) 编辑

【NeurIPS2022】Fast Vision Transformers with HiLo Attention

摘要：这个论文的核心贡献是提出了一种新的注意力机制 HiLo（High / Low frequency）。如下图所示，在上面部分，分配了

1 - α

$1-\alpha$ 比例的 head 用于提取高频注意力，下面分配了

α

$\alpha$ 比例的 head 用于提取低频注意力。高频注意力：在2x2的窗口中计算 a 阅读全文

posted @ 2022-12-03 20:20 高峰OUC 阅读(225) 评论(0) 推荐(0) 编辑

【ECCV2022】DaViT: Dual Attention Vision Transformers

摘要：【ECCV2022】DaViT: Dual Attention Vision Transformers 代码：https://github.com/dingmyu/davit 这个论文想法很自然也容易想到。Transformer都是在处理 PxC 二维的数据，其中 P 是token 的数量，C是特征阅读全文

posted @ 2022-11-18 19:33 高峰OUC 阅读(240) 评论(0) 推荐(0) 编辑

【ARXIV2207】LightViT: Towards Light-Weight Convolution-Free Vision Transformers

摘要：【ARXIV2207】LightViT: Towards Light-Weight Convolution-Free Vision Transformers 论文地址：https://arxiv.org/abs/2207.05557 代码地址：https://github.com/hunto/Lig 阅读全文

posted @ 2022-11-18 07:00 高峰OUC 阅读(124) 评论(0) 推荐(0) 编辑

【ECCV2022】AMixer: Adaptive Weight Mixing for Self-Attention Free Vision Transformers

摘要：1、Motivation 这个论文来自于清华大学鲁继文老师团队，核心是 attention 和 MLP-mixer 思想的结合。建议用2分钟时间学习一下谷歌公司的 MLP-Mixer 「MLP-Mixer: An all-MLP Architecture for Vision」CVPR 2021 阅读全文

posted @ 2022-11-14 18:13 高峰OUC 阅读(223) 评论(0) 推荐(0) 编辑

【CVPR2021】MLP-Mixer: An all-MLP Architecture for Vision

摘要：用5分钟时间学习一下谷歌公司的 MLP-Mixer 「MLP-Mixer: An all-MLP Architecture for Vision」CVPR 2021 CNN以及 attention 在视觉任务上取得非常好的性能，但是我们真的需要这么复杂的网络结构吗？MLP 这种简单的结构是否也能够取阅读全文

posted @ 2022-11-03 03:16 高峰OUC 阅读(326) 评论(0) 推荐(0) 编辑

【ACMMM 2022】Depth-inspired Label Mining for Unsupervised RGB-D Salient Object Detection

摘要：【ACMMM 2022】Depth-inspired Label Mining for Unsupervised RGB-D Salient Object Detection 代码：https://github.com/youngtboy/DLM 这篇论文主要是利用无监督的思想，来解决RGBD显著性阅读全文

posted @ 2022-10-29 00:19 高峰OUC 阅读(111) 评论(0) 推荐(0) 编辑

【ACMMM 2022】Learning Hierarchical Dynamics with Spatial Adjacency for Image Enhancement

摘要：【ACMMM 2022】Learning Hierarchical Dynamics with Spatial Adjacency for Image Enhancement 代码：https://github.com/DongLiangSXU/HDM 该论文的研究动机：近年来动态网络非常流行，因此阅读全文

posted @ 2022-10-28 21:17 高峰OUC 阅读(115) 评论(0) 推荐(0) 编辑

【ACMMM2022】Structure-Inferred Bi-level Model for Underwater Image Enhancement

摘要：【ACMMM2022】Structure-Inferred Bi-level Model for Underwater Image Enhancement 代码：https://github.com/IntegralCoCo/SIBM （暂未开源）该论文提出了一个 Structural-Infer 阅读全文

posted @ 2022-10-28 20:34 高峰OUC 阅读(109) 评论(0) 推荐(0) 编辑

【NeurIPS 2022】SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

摘要：【NeurIPS 2022】SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation 代码：https://github.com/Visual-Attention-Network/SegNeXt 1、研究阅读全文

posted @ 2022-10-05 19:17 高峰OUC 阅读(985) 评论(0) 推荐(0) 编辑

OUC计算机科研狗

我们还有一种最后的自由，那就是选择自己的态度

随笔分类 - 论文推介

公告

搜索

最新随笔

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜