05 2024 档案

摘要:前言 本文提出了一种新的方法解决单张 2D 全景图恢复 360 度 3D 全景问题,利用扩散模型的先验知识和单目深度估计器进行合作修补大尺度遮挡区域,并提出了一种新的冲突避免策略,实现了当前最佳的单张全景图恢复 360 度 3D 场景的效果。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、 阅读全文
posted @ 2024-05-28 20:38 CV技术指南(公众号) 阅读(524) 评论(0) 推荐(0) 编辑
摘要:前言 本文介绍了香港科技大学(广州)的一篇关于大模型高效微调(LLM PEFT Fine-tuning)的文章「Parameter-Efficient Fine-Tuning with Discrete Fourier Transform」,本文被 ICML 2024 接收,代码已开源。 欢迎关注公 阅读全文
posted @ 2024-05-28 20:30 CV技术指南(公众号) 阅读(308) 评论(0) 推荐(0) 编辑
摘要:前言 目标检测领域,迎来了新进展——Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自量子位 仅用于学术分享,若侵权请联系删除 CV方向的准研究生们,未 阅读全文
posted @ 2024-05-28 13:19 CV技术指南(公众号) 阅读(3412) 评论(0) 推荐(0) 编辑
摘要:前言 来自浙江大学和西湖大学的研究人员提出了一种基于 CNN-Transformer 架构的高效、大尺度视频单曝光压缩成像重建算法 EfficientSCI++。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自PaperWeekly 仅 阅读全文
posted @ 2024-05-28 13:11 CV技术指南(公众号) 阅读(100) 评论(0) 推荐(0) 编辑
摘要:前言 第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了! 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、diffus 阅读全文
posted @ 2024-05-27 18:16 CV技术指南(公众号) 阅读(712) 评论(0) 推荐(0) 编辑
摘要:前言 本期发布的岗位有:硬件系统工程师(北京)、RSDE视觉算法工程师(北京)、海外销售经理(北京)、大客户销售经理(北京/深圳/广州/上海/苏州/合肥/长春/青岛/重庆/长沙)。文末附简历投递方式。如果您也想发布企业招聘信息,请在公众号菜单栏中联系我们。 欢迎关注公众号CV技术指南,专注于计算机视 阅读全文
posted @ 2024-05-27 14:56 CV技术指南(公众号) 阅读(31) 评论(0) 推荐(0) 编辑
摘要:前言 无位置编码(NoPE)的 Transformer 已经被证明在自回归语言模型任务上和 Transformer+RoPE 效果相当,但是 NoPE 的长度泛化问题并没有改善,和 RoPE 一样严重。华师、复旦、上海 AI Lab 联合团队基于 NoPE,在排除位置编码影响下,研究长度泛化失败的表 阅读全文
posted @ 2024-05-27 14:52 CV技术指南(公众号) 阅读(172) 评论(0) 推荐(0) 编辑
摘要:前言 本文对主流的扫描方向及其组合对遥感图像语义分割的影响进行了全面的实验研究。通过在LoveDA、ISPRS Potsdam和ISPRS Vaihingen数据集上广泛的实验,我们证明了无论其复杂性或扫描方向的数量,没有一个扫描策略能够显著优于其他策略。所以对于高分辨率遥感图像的语义分割,简单的单 阅读全文
posted @ 2024-05-18 19:05 CV技术指南(公众号) 阅读(879) 评论(0) 推荐(0) 编辑
摘要:前言 本文介绍了一些Transformers常用的加速策略。 本文转载自Deephub Imba 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、 阅读全文
posted @ 2024-05-18 11:55 CV技术指南(公众号) 阅读(63) 评论(0) 推荐(0) 编辑
摘要:前言 基于YOLO的目标检测算法在速度和准确性之间取得了显著的平衡。然而,它们在脑肿瘤检测中的应用仍然未被充分探索。本研究提出了RepVGG-GELAN,这是一种新型的YOLO架构,通过集成RepVGG,一种重新参数化的卷积方法,特别关注于医学图像中的脑肿瘤检测。RepVGG-GELAN利用RepV 阅读全文
posted @ 2024-05-18 11:52 CV技术指南(公众号) 阅读(238) 评论(0) 推荐(0) 编辑
摘要:前言 最近OCC的综述很多,这两天arxiv上又挂出来一篇,从信息融合的角度全面回顾了占用网络的相关工作,值得一看! 本文转载自自动驾驶之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们,未 阅读全文
posted @ 2024-05-16 22:59 CV技术指南(公众号) 阅读(216) 评论(0) 推荐(0) 编辑
摘要:前言 本文介绍了一些Transformers常用的加速策略。 本文转载自Deephub Imba 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、 阅读全文
posted @ 2024-05-16 22:55 CV技术指南(公众号) 阅读(138) 评论(0) 推荐(0) 编辑
摘要:前言 本文将详细介绍了BiTCN,这是2023年3月在《Parameter-efficient deep probabilistic forecasting》一文中提出的模型。通过利用两个时间卷积网络(TCN),该模型可以编码过去和未来的协变量,同时保持计算效率。 作者:Marco Peixeiro 阅读全文
posted @ 2024-05-14 18:15 CV技术指南(公众号) 阅读(285) 评论(0) 推荐(0) 编辑
摘要:前言 LSTM:这次重生,我要夺回 Transformer 拿走的一切。 本文转载自新智元 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、dif 阅读全文
posted @ 2024-05-14 18:08 CV技术指南(公众号) 阅读(1011) 评论(0) 推荐(0) 编辑
摘要:前言 近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3。 本文转载自新智元 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招 阅读全文
posted @ 2024-05-14 11:11 CV技术指南(公众号) 阅读(123) 评论(0) 推荐(0) 编辑
摘要:前言 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。 本文转载自量子位(QbitAI) 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 阅读全文
posted @ 2024-05-07 22:33 CV技术指南(公众号) 阅读(968) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示