2024 年 5月随笔档案 - CV技术指南（公众号）

顶刊TPAMI 2024 | PERF：一张2D全景图可合成高质量的360度3D场景

摘要：前言本文提出了一种新的方法解决单张 2D 全景图恢复 360 度 3D 全景问题，利用扩散模型的先验知识和单目深度估计器进行合作修补大尺度遮挡区域，并提出了一种新的冲突避免策略，实现了当前最佳的单张全景图恢复 360 度 3D 场景的效果。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、阅读全文

posted @ 2024-05-28 20:38 CV技术指南（公众号）阅读(524) 评论(0) 推荐(0) 编辑

ICML 2024 | 新型傅立叶微调来了！脱离LoRA架构，训练参数大幅减少

摘要：前言本文介绍了香港科技大学（广州）的一篇关于大模型高效微调（LLM PEFT Fine-tuning）的文章「Parameter-Efficient Fine-Tuning with Discrete Fourier Transform」，本文被 ICML 2024 接收，代码已开源。欢迎关注公阅读全文

posted @ 2024-05-28 20:30 CV技术指南（公众号）阅读(308) 评论(0) 推荐(0) 编辑

检测一切！Grounding DINO 1.5：最强开集目标检测模型

摘要：前言目标检测领域，迎来了新进展——Grounding DINO 1.5，IDEA研究院团队出品，在端侧就可实现实时识别。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自量子位仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未阅读全文

posted @ 2024-05-28 13:19 CV技术指南（公众号）阅读(3412) 评论(0) 推荐(0) 编辑

顶刊IJCV 2024 | EfficientSCI++：高效的视频单曝光压缩成像重建框架

摘要：前言来自浙江大学和西湖大学的研究人员提出了一种基于 CNN-Transformer 架构的高效、大尺度视频单曝光压缩成像重建算法 EfficientSCI++。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自PaperWeekly 仅阅读全文

posted @ 2024-05-28 13:11 CV技术指南（公众号）阅读(100) 评论(0) 推荐(0) 编辑

CVPR 2024 | 谷歌提出OmniGlue：特征匹配新工作

摘要：前言第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了！欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、diffus 阅读全文

posted @ 2024-05-27 18:16 CV技术指南（公众号）阅读(712) 评论(0) 推荐(0) 编辑

迁移科技招聘 | 来自研发及销售岗位的心动Offer，@视觉人才请查收！

摘要：前言本期发布的岗位有：硬件系统工程师（北京）、RSDE视觉算法工程师（北京）、海外销售经理（北京）、大客户销售经理（北京/深圳/广州/上海/苏州/合肥/长春/青岛/重庆/长沙）。文末附简历投递方式。如果您也想发布企业招聘信息，请在公众号菜单栏中联系我们。欢迎关注公众号CV技术指南，专注于计算机视阅读全文

posted @ 2024-05-27 14:56 CV技术指南（公众号）阅读(31) 评论(0) 推荐(0) 编辑

无位置编码 (NoPE) 也有长度泛化问题？首个针对NoPE的长度外推方法

摘要：前言无位置编码（NoPE）的 Transformer 已经被证明在自回归语言模型任务上和 Transformer+RoPE 效果相当，但是 NoPE 的长度泛化问题并没有改善，和 RoPE 一样严重。华师、复旦、上海 AI Lab 联合团队基于 NoPE，在排除位置编码影响下，研究长度泛化失败的表阅读全文

posted @ 2024-05-27 14:52 CV技术指南（公众号）阅读(172) 评论(0) 推荐(0) 编辑

视觉Mamba的多向扫描策略真的有效吗？

摘要：前言本文对主流的扫描方向及其组合对遥感图像语义分割的影响进行了全面的实验研究。通过在LoveDA、ISPRS Potsdam和ISPRS Vaihingen数据集上广泛的实验，我们证明了无论其复杂性或扫描方向的数量，没有一个扫描策略能够显著优于其他策略。所以对于高分辨率遥感图像的语义分割，简单的单阅读全文

posted @ 2024-05-18 19:05 CV技术指南（公众号）阅读(879) 评论(0) 推荐(0) 编辑

Transformers 加速的一些常用技巧

摘要：前言本文介绍了一些Transformers常用的加速策略。本文转载自Deephub Imba 仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、阅读全文

posted @ 2024-05-18 11:55 CV技术指南（公众号）阅读(63) 评论(0) 推荐(0) 编辑

RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层！

摘要：前言基于YOLO的目标检测算法在速度和准确性之间取得了显著的平衡。然而，它们在脑肿瘤检测中的应用仍然未被充分探索。本研究提出了RepVGG-GELAN，这是一种新型的YOLO架构，通过集成RepVGG，一种重新参数化的卷积方法，特别关注于医学图像中的脑肿瘤检测。RepVGG-GELAN利用RepV 阅读全文

posted @ 2024-05-18 11:52 CV技术指南（公众号）阅读(238) 评论(0) 推荐(0) 编辑

信息融合是Occupancy任务必要的吗？工业界是怎么做的？

摘要：前言最近OCC的综述很多，这两天arxiv上又挂出来一篇，从信息融合的角度全面回顾了占用网络的相关工作，值得一看！本文转载自自动驾驶之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们，未阅读全文

posted @ 2024-05-16 22:59 CV技术指南（公众号）阅读(216) 评论(0) 推荐(0) 编辑

Transformers 加速的一些常用技巧

摘要：前言本文介绍了一些Transformers常用的加速策略。本文转载自Deephub Imba 仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、阅读全文

posted @ 2024-05-16 22:55 CV技术指南（公众号）阅读(138) 评论(0) 推荐(0) 编辑

BiTCN：基于卷积网络的多元时间序列预测

摘要：前言本文将详细介绍了BiTCN，这是2023年3月在《Parameter-efficient deep probabilistic forecasting》一文中提出的模型。通过利用两个时间卷积网络(TCN)，该模型可以编码过去和未来的协变量，同时保持计算效率。作者：Marco Peixeiro 阅读全文

posted @ 2024-05-14 18:15 CV技术指南（公众号）阅读(285) 评论(0) 推荐(0) 编辑

LSTM卷土重来！xLSTM：一举超越Mamba、Transformer！

摘要：前言 LSTM：这次重生，我要夺回 Transformer 拿走的一切。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、dif 阅读全文

posted @ 2024-05-14 18:08 CV技术指南（公众号）阅读(1011) 评论(0) 推荐(0) 编辑

ICML 2024 | 文生图新SOTA！Pika北大斯坦福联合推出RPG：多模态助力解决文生图两大难题

摘要：前言近日，北大、斯坦福、以及Pika Labs发布了新的开源文生图框架，利用多模态LLM的能力成功解决文生图两大难题，表现超越SDXL和DALL·E 3。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招阅读全文

posted @ 2024-05-14 11:11 CV技术指南（公众号）阅读(123) 评论(0) 推荐(0) 编辑

CVPR 2024 | 字节提出视觉基础模型：ViTamin，实现多项SOTA！

摘要：前言视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。本文转载自量子位（QbitAI）仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。阅读全文

posted @ 2024-05-07 22:33 CV技术指南（公众号）阅读(968) 评论(0) 推荐(0) 编辑

05 2024 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论