上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 48 下一页
摘要: 在本文中,作者提出了一种端到端的动作预测注意模型,称为Future Transformer(FUTR),该模型利用所有输入帧和输出标记上的全局注意来预测未来动作的分钟长序列。与以往的自回归模型不同,该方法在并行解码中学习预测未来动作的整个序列,从而为长期预测提供更准确和快速的推理。 阅读全文
posted @ 2022-06-26 19:38 CV技术指南(公众号) 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 前言 在本文中,作者引入了一个简单的框架,即Slimmable Domain Adaptation,以通过权重共享模型库改进跨域泛化,从中可以对不同容量的模型进行采样,以适应不同的精度效率权衡。此外,作者还开发了一种随机集成蒸馏方法,以充分利用模型库中的互补知识进行模型间交互。在各种资源限制下,作者 阅读全文
posted @ 2022-06-23 23:04 CV技术指南(公众号) 阅读(510) 评论(0) 推荐(0) 编辑
摘要: 前言 本文提出了一种新的弱监督多标签分类(WSML)方法,该方法拒绝或纠正大损失样本,以防止模型记忆有噪声的标签。由于没有繁重和复杂的组件,提出的方法在几个部分标签设置(包括Pascal VOC 2012、MS COCO、NUSWIDE、CUB和OpenImages V3数据集)上优于以前最先进的W 阅读全文
posted @ 2022-06-21 21:19 CV技术指南(公众号) 阅读(596) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 本文对计算机视觉论文中常出现的单词进行了汇总,对于不具备直接阅读英文文献的读者,可以考虑把这些单词给背了。 之前的文章《计算机视觉中的高效阅读论文的方法总结》中提到了如何掌握阅读英文文献的能力,我就是按照这个方法来做的,下面是我在执行过程中记录的单词。 差不多在背完这些单词后,我基本就没再 阅读全文
posted @ 2022-06-17 12:13 CV技术指南(公众号) 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 前言 本文深入探讨了如何设计神经网络、如何使得训练神经网络具有更加优异的效果,以及思考网络设计的物理意义。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 论文:https://arxiv.org/pdf/2201.03545.pdf 代码: ht 阅读全文
posted @ 2022-06-13 11:37 CV技术指南(公众号) 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 前言 本文提出了一种基于深度感知的全景分割(DPS)的统一框架,旨在从一幅图像中重建具有实例级语义的三维场景。该框架将动态卷积技术应用于全景分割(PS)和深度预测任务中,以生成特定于实例的内核来预测每个实例的深度和分割掩码。此外,利用实例级深度估计方案,添加了额外的实例级深度线索,以通过新的深度损失 阅读全文
posted @ 2022-06-11 11:42 CV技术指南(公众号) 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 前言 本文提出了一种简单而有效的动态优化池操作( Dynamically Optimized Pooling operation),称为DynOPool,它通过学习每一层感受野的最佳大小和形状来优化特征映射的端到端比例因子。深度神经网络中任何类型的调整大小模块都可以用DynOPool操作以最小的成本 阅读全文
posted @ 2022-06-07 22:02 CV技术指南(公众号) 阅读(477) 评论(0) 推荐(1) 编辑
摘要: 前言 构建能够检测分布外(OOD)目标的可靠目标检测器是至关重要的,但尚未得到充分探索。关键挑战之一是,模型缺乏来自未知数据的监督信号,从而对OOD对象产生过于自信的预测。文章提出了一种基于时空未知蒸馏(STUD)的未知目标检测框架,该框架从野外视频中提取(蒸馏出)未知目标,并对模型的决策边界进行有 阅读全文
posted @ 2022-06-06 11:23 CV技术指南(公众号) 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 前言 本文来自读者投稿,我们会在群内发最近几天出来的最新顶会论文,大家可以及时去阅读这些顶会,并写一个解读给我们投稿,会发稿费。加群请扫描文末二维码。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 论文:Knowledge Distillatio 阅读全文
posted @ 2022-06-02 12:05 CV技术指南(公众号) 阅读(283) 评论(0) 推荐(0) 编辑
摘要: ​ ​编辑 这些题目来自知识星球【CV技术指南(免费版)】的日常作业 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 1. 神经网络的层数是如何数的? 我们说的网络越深,模型效果越好,指的是可训练参数越多,模型的特征提取能力或表示能力更好。 因此, 阅读全文
posted @ 2022-05-31 17:14 CV技术指南(公众号) 阅读(615) 评论(0) 推荐(0) 编辑
上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 48 下一页