CV技术指南（公众号）

2024年3月6日

ICLR 2024｜图像匹配新突破！GIM：首个从互联网视频中学习通用图像匹配器的框架

摘要：前言为了解决基于深度学习方法泛化性的问题，来自厦门大学、Intel、大疆的研究者们提出了 GIM: Learning Generalizable Image Matcher from Internet Videos。GIM 是第一个可以让匹配模型从互联网视频中学习到强泛化能力的训练框架。本文转载阅读全文

posted @ 2024-03-06 22:46 CV技术指南（公众号）阅读(318) 评论(0) 推荐(0) 编辑

2024年3月5日

Pytorch中张量的高级选择操作

摘要：前言在某些情况下，我们需要用Pytorch做一些高级的索引/选择，所以在这篇文章中，将介绍这类任务的三种最常见的方法：torch.index_select, torch.gather and torch.take 本文转载自Deephub Imba 作者：Oliver S 仅用于学术分享，若侵权请阅读全文

posted @ 2024-03-05 01:05 CV技术指南（公众号）阅读(87) 评论(0) 推荐(0) 编辑

2024年3月2日

CVPR 2024 满分论文！Meta提出EfficientSAM：快速分割一切！

摘要：前言 Meta 研究者提出了一种改进思路，利用 SAM 的掩码图像预训练 (SAMI)。这是通过利用 MAE 预训练方法和 SAM 模型实现的，以获得高质量的预训练 ViT 编码器。这一方法降低了 SAM 的复杂性，同时能够保持良好的性能。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎阅读全文

posted @ 2024-03-02 19:23 CV技术指南（公众号）阅读(1140) 评论(0) 推荐(0) 编辑

2024年1月9日

多模态大模型少样本自适应综述

摘要：前言在医学成像和遥感等一些细粒度领域，多模态基础模型的性能往往不尽人意。因此，许多研究者开始探索这些模型的少样本适应方法，逐渐衍生出三种主要技术途径：1）基于提示的方法；2）基于适配器的方法；3）基于外部知识的方法。尽管如此，这一迅速发展的领域产生了大量结果，但尚无全面的综述来系统地整理研究进展。阅读全文

posted @ 2024-01-09 16:36 CV技术指南（公众号）阅读(795) 评论(0) 推荐(0) 编辑

2024年1月8日

顶配版SAM！由分割一切迈向感知一切

摘要：前言智源研究院视觉团队推出以视觉感知为中心的基础模型 TAP (Tokenize Anything via Prompting), 利用视觉提示同时完成任意区域的分割、识别与描述任务。将基于提示的分割一切基础模型 (SAM) 升级为标记一切基础模型 (TAP) ，高效地在单一视觉模型中实现对任意区阅读全文

posted @ 2024-01-08 17:12 CV技术指南（公众号）阅读(249) 评论(0) 推荐(0) 编辑

2024年1月6日

加速Python循环的12种方法,最高可以提速900倍

摘要：前言本文介绍了一些简单的方法，可以将Python for循环的速度提高1.3到900倍。本文转载自Deephub Imba 仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程阅读全文

posted @ 2024-01-06 21:45 CV技术指南（公众号）阅读(2085) 评论(0) 推荐(0) 编辑

2024年1月5日

Github揽获3k+星！清华开源CogAgent：基于多模态大模型的GUI Agent

摘要：前言本文提出了视觉 GUI Agent，使用视觉模态（而非文本）对 GUI 界面进行更全面直接的感知，从而做出规划和决策。对此，我们研发了多模态大模型 CogAgent，可接受 1120×1120 的高分辨率图像输入，不仅提升了通用视觉理解能力，还具备强大的 GUI Agent 能力。本文转载自阅读全文

posted @ 2024-01-05 17:30 CV技术指南（公众号）阅读(605) 评论(0) 推荐(0) 编辑

2024年1月4日

NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读

摘要：前言 NeurIPS 2023（Neural Information Processing Systems）神经信息处理系统大会是当前全球最负盛名的 AI 学术会议之一，将于 12 月 10 日在美国新奥尔良召开。官方信息显示，本届会议共有 12343 篇有效论文投稿，接收率为 26.1％，略高于阅读全文

posted @ 2024-01-04 16:18 CV技术指南（公众号）阅读(114) 评论(0) 推荐(0) 编辑

2024年1月2日

NeruIPS 2023 | SegRefiner：通过扩散模型实现高精度图像分割

摘要：前言尽管图像分割在过去得到了广泛研究和快速发展，但获得细节上非常准确的分割 mask 始终十分具有挑战性。因为达成高精度的分割既需要高级语义信息，也需要细粒度的纹理信息，这将导致较大的计算复杂性和内存使用。而对于分辨率达到2K甚至更高的图像，这一挑战尤为突出。由于直接预测高质量分割 mask 具有阅读全文

posted @ 2024-01-02 17:14 CV技术指南（公众号）阅读(565) 评论(0) 推荐(0) 编辑

2024年1月1日

处理不平衡数据的过采样技术对比总结

摘要：前言本文对处理不平衡数据的过采样技术进行了对比总结。本文转载自Deephub Imba 作者：Abdallah Ashraf 仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教阅读全文

posted @ 2024-01-01 19:29 CV技术指南（公众号）阅读(228) 评论(0) 推荐(0) 编辑

公告