02 2023 档案
摘要:前言 MMRazor 是 OpenMMLab 生态的面向模型压缩的开源算法库,目前主要涵盖了知识蒸馏、剪枝、NAS 三类算法。本文介绍了如何使用 MMRazor 实现知识蒸馏。 本文转载自OpenMMLab 作者 | 带来新知识的 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪
阅读全文
摘要:前言 本文设计一种8-bit量化版高效网络并将其部署到移动端,旨在构建一种实时量化模型用于真实场景(比如实时视频超分)。 本文转载自AIWalker 来源 | HappyAIWalker 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入
阅读全文
摘要:前言 本文将结合 MMYOLO,对训练过程中常见的可视化需求进行详细描述。 本文转载自OpenMMLab 来源 | 带来新知识的 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 主要内容如下: 训练 loss 和评估指标
阅读全文
摘要:前言 本章分别从硬件层面和软件层面对 CUDA 编程模型进行描述。主要讨论 GPU 的并行计算是如何在硬件上实现的,CUDA 中的模块理解以及 CPU和 GPU 之间的交互,指令的同步。这部分内容比较抽象和枯燥,希望大家耐心看完。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪
阅读全文
摘要:前言 今年腾讯优图实验室共有16篇论文入选,内容涵盖了多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向,展示了腾讯优图在人工智能领域的技术能力和学术成果。本文介绍了腾讯优图实验室入选论文及方法概述。 来源 | 腾讯优图 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪
阅读全文
摘要:前言 针对点云稀疏性带来3D目标检测上的困难,涌现了一系列方法来缓解该问题,包括多模态数据融合、点云下采样方法的改进、基于知识蒸馏的特征学习和点云补全等。下面,本文将对当前研究较多的解决点云稀疏性的方法进行汇总和总结,希望可以给大家带来一些启发。 本文转载自自动驾驶之心 作者 | 贫困人口 欢迎关注
阅读全文
摘要:前言 本文介绍的这篇文章提供了关于扩散模型从其训练数据中复制内容的潜力的重要见解,这项研究可以帮助改进扩散模型的设计和训练,确保它们能够生成独特的原创艺术和图形,非常值得大家借鉴。 本文转载自CVHub 作者 | 派派星 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文
阅读全文
摘要:前言 目前,基于机器视觉的表面缺陷已经在各个工业领域广泛取代人工视觉检测,包括3C、汽车、家电、机械制造、半导体电子、化工、制药、航空航天、轻工等行业。许多基于深度学习的缺陷检测方法也被广泛应用于各种工业场景。本文的代码实战,是基于YOLOv5目标检测算法,在NEU表面缺陷数据集上实现钢材表面缺陷检
阅读全文
摘要:前言 该系列教程旨在向计算机视觉领域入门者介绍当下流行的 OpenMMLab 框架,从计算机视觉领域多个基础任务入手,详细解读其基础知识、在 OpenMMLab 体系下的组织构建方式、基本使用方法,以及如何利用 OpenMM 系列算法进行自己的拓展和改进。 欢迎关注公众号CV技术指南,专注于计算机视
阅读全文
摘要:前言 今天这里主要介绍使用Python部署TensorRT的模型以及使用C++部署TensorRT的模型这两种方法。其实在日常部署的工作中,更多是使用C++进行部署,因为这样可以更加丝滑地迁移到硬件上进行编译使用。又因为我们一般是部署在Linux平台上,不管是服务器还是边缘设备,使用的系统大多都是L
阅读全文
摘要:前言 本文将对 response-based、feature-based 和relation-based 这三类基础 KD 算法进行重点介绍,为大家后续的深入研究、交流打下基础。 本文转载自OpenMMLab 作者 | 带来新知识的 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟
阅读全文
摘要:前言 本文以通俗易懂的方式,介绍注意力机制的系列变形方法。 本文转载自CVHub 作者 | 派派星 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 导读 视觉注意力机制是人类视觉所特有的一种大脑信号处理机制,而深度学习中
阅读全文
摘要:前言 生成对抗网络 (Generative Adversarial Networks, GANs) 在过去几年中被广泛地研究,其在图像生成、图像转换和超分辨率等领域取得了显著的进步。到目前为止,已经提出了大量基于GANs的相关工作和综述。本文基于柏林圣三一大学计算机科学与统计学院的王正蔚博士与字节跳
阅读全文
摘要:前言 本文将带大家了解 CUDA 编程,学习使用C和Python调用CUDA编程接口,对模型进行推理加速,性能优化。我们将从底层原理开始,带大家了解CUDA的工作机制,一步步掌握CUDA编程。相信大家会受益菲浅。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、C
阅读全文
摘要:前言 本文结合相关论文介绍了一些半监督目标检测算法,即如何利用大量的 unlabeled data 提升模型的检测性能。 本文转载自极市平台 作者丨kinredon 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 什么是
阅读全文
摘要:前言 本文将对目标检测领域的发展做一个系统性的介绍,旨在为读者构建一个完整的知识体系架构,同时了解目标检测相关的技术栈及其未来的发展趋势。 本文转载自CVHub 作者丨派派星 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导
阅读全文
摘要:前言 最近 AI 绘图非常的火,其背后用到的核心技术之一就是 Diffusion Model(扩散模型),虽然想要完全弄懂 Diffusion Model 和其中复杂的公式推导需要掌握比较多的前置数学知识,但这并不妨碍我们去理解其原理。接下来会以笔者所理解的角度去讲解什么是 Diffusion Mo
阅读全文
摘要:前言 本文介绍了Windows10下YOLOv8 TensorRT CUDA加速部署。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 TensorRT-Alpha基于tensorrt+cuda c实现模型end2end
阅读全文
摘要:前言 在卷成麻花的2022年,一个没有上述背景、没有名校撑腰的普通科班小硕能入坑中大厂的CV算法岗吗?作者现身说法:还是能! 作者:记忆的迷谷@知乎(已授权CV技术指南转载) 来源:https://mp.weixin.qq.com/s/FokKQ2eTsjhUquGmgo3SBQ 欢迎关注公众号CV
阅读全文
摘要:前言 本文介绍了引入增量学习的必要性,继而引出最新的三种能够有效利用有效标签数据范式的增量学习方法。其次,针对这三大范式进行一个全面的调研,让大家对这个领域的整个发展脉络有一个清晰的认识。文章的最后,集中讨论当前增量学习存在的一些局限性以及结合现有的技术给出一些值得探讨的研究方向。 本文转载自CVH
阅读全文
摘要:前言 本文介绍了BEVDet实现过程中的代码注释,希望能帮助大家更好地理解如何从论文原理到mmdet3d上代码实现BEVDet。 本文转载自自动驾驶之心 作者丨小书童 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 1、
阅读全文
摘要:前言 水下目标检测旨在对水下场景中的物体进行定位和识别。这项研究由于在海洋学、水下导航等领域的广泛应用而引起了持续的关注。但是,由于复杂的水下环境和光照条件,这仍然是一项艰巨的任务。因此近年来有多个赛事与水下目标检测相关,接下来我们将介绍在水下目标检测领域的深度学习方法概述。 本文转载自AI约读社
阅读全文
摘要:前言 本文介绍了一系列可视化方法探索了神经损失函数的结构,以及loss landscape对泛化的影响,提出了一种基于 "Filter Normalization" 的简单可视化方法。当使用这种归一化时,最小化的锐度与泛化误差有很高的相关性,这种展示的可视化结果非常清晰。 本文转载自极市平台 作者丨
阅读全文
摘要:前言 本文回顾了深度多模态学习方法的演变,并讨论了使主干对各种下游任务具有鲁棒性所需的预训练的类型和目标。 本文转载自专知 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 多模态表示学习是一种学习从不同模态及其相关性中嵌
阅读全文
摘要:前言 本文是一篇综述性的博客,探讨总结当下常用的大型 transformer 效率优化方案。 本文转载自机器之心 作者丨Lilian Weng 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 大型 Transformer
阅读全文
摘要:前言 本文介绍了深度理解变分自编码器(VAE)的系列发展及相应的局限性。 本文转载自CVHub 作者丨派派星 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 计算机视觉入门1v3辅导班 导读 本文是笔者早前写过的一篇关于 VAE 的读书笔记,先整理
阅读全文
摘要:前言 现有的头部姿势估计主要集中在具有预先检测到的正面头部的单个人,这依赖于单独训练的面部检测器,不能很好地泛化到完整的视点。在本文中,作者关注全范围 MPHPE 问题,并提出了一个名为 DirectMHP 的直接端到端简单基线,通过多头的联合回归位置和方向设计了一种新颖的端到端可训练单级网络架构,
阅读全文
摘要:前言 本文旨在计算和内存限制的情况下,解决在大规模图像上训练现有CNN 架构的问题。提出PatchGD,它基于这样的假设:与其一次对整个图像执行基于梯度的更新,不如一次只对图像的一小部分执行模型更新,确保其中的大部分是在迭代过程中覆盖。 当在大规模图像上训练模型时,PatchGD 广泛享有更好的内存
阅读全文
摘要:前言 LiDAR 语义分割通过直接作用于传感器提供的原始内容来完成细粒度的场景理解而受到关注。最近的解决方案展示了如何使用不同的学习技术来提高模型的性能,而无需更改任何架构或数据集。遵循这一趋势,论文提出了一个从粗到精的设置,该设置从标准模型派生的分类错误 (LEAK) 中学习。 欢迎关注公众号CV
阅读全文
摘要:前言 本文为大家重点剖析现有的语义分割框架,带领大家一步步探讨。 本文转载自CVHub 作者丨派派星 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 先来简单总结下传统图像分割。对于传统的图像分割算法,无论是阈值分割、区域分割、边缘分割或基于聚类的
阅读全文
摘要:前言 本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。 来源丨CVer 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 Workshop主页链接: https://www.vspwdatase
阅读全文
摘要:前言 本文讨论了处理不平衡数据集和提高机器学习模型性能的各种技巧和策略,涵盖的一些技术包括重采样技术、代价敏感学习、使用适当的性能指标、集成方法和其他策略。作者:Emine Bozkuş来源:DeepHub IMBA 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读
阅读全文
摘要:前言 常规迁移学习中,源域和目标域间的分布偏移问题可以通过fine-tuning缓解。但在小样本问题中,可供fine-tuning的有标签数据不足(也就是常说的每个小样本任务中的support set),分布偏移问题难以解决,因此面对小样本问题时,fine-tuning策略是需要额外关照的。本文回顾
阅读全文