上一页 1 ··· 36 37 38 39 40 41 42 43 44 ··· 48 下一页
摘要: ​ 论文:Rethinking Counting and Localization in Crowds:A Purely Point-Based Framework 代码:https://github.com/TencentYoutuResearch/CrowdCounting-P2PNet 获取: 阅读全文
posted @ 2021-08-14 19:52 CV技术指南(公众号) 阅读(594) 评论(0) 推荐(0) 编辑
摘要: ​ 论文:Rethinking Spatial Dimensions of Vision Transformers 代码:https://github.com/naver-ai/pit 获取:在CV技术指南后台回复“0006” 点个关注,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 前言 阅读全文
posted @ 2021-08-07 16:46 CV技术指南(公众号) 阅读(390) 评论(0) 推荐(0) 编辑
摘要: ​ 论文:End-to-End Video Instance Segmentation with Transformers 获取:在CV技术指南后台回复关键字“0005”获取该论文。 代码:https://git.io/VisTR 点个关注,专注于计算机视觉技术文章。 前言: 视频实例分割(VIS) 阅读全文
posted @ 2021-08-06 18:36 CV技术指南(公众号) 阅读(438) 评论(0) 推荐(0) 编辑
摘要: ​ 作者:Lawliet 翻译:仿佛若有光 前言: 几个月前,我根据 Simoncelli 2016 年的论文编写了自己的自动编码器,用于研究目的。一开始,我想使用一些流行的深度学习框架(例如 Tensor Flow、Caffe2 或 MXNet)来做我的实验。然而,在对所有这些框架进行了几周的调查 阅读全文
posted @ 2021-08-03 22:05 CV技术指南(公众号) 阅读(367) 评论(0) 推荐(0) 编辑
摘要: ​ 作者:Synced 翻译:仿佛若有光 第三十五届 AAAI 人工智能会议 (AAAI-21) 以虚拟会议的形式拉开帷幕。组委会在开幕式上公布了最佳论文奖和亚军。三篇论文获得了最佳论文奖,三篇被评为亚军。 AAAI 2021 共收到 9,034 篇论文,再创历史新高,超过了去年的 8800 篇。来 阅读全文
posted @ 2021-08-03 09:46 CV技术指南(公众号) 阅读(527) 评论(0) 推荐(1) 编辑
摘要: ​ 作者:Ilias Mansouri 翻译:仿佛若有光 Introduction 顾名思义,通过姿势估计,我们尝试从图像中推断出物体或人的姿势。这涉及识别和定位身体上的关键点。由于身体的小关节、遮挡和缺乏上下文、旋转和方向,关键点的识别是一项非常具有挑战性的任务。在本文其余部分将主要关注人体姿势估 阅读全文
posted @ 2021-08-01 18:03 CV技术指南(公众号) 阅读(773) 评论(0) 推荐(0) 编辑
摘要: ​前言: 在之前写的一篇计算机视觉入门路线文章中,我推荐大家在不用任何框架、只使用numpy这种包的情况下,从零实现一个卷积神经网络。其中一个很重要的因素就是在这个过程中大家会了解到卷积过程在底层中是如何优化实现的,其主流的方法就是GEMM。这篇博客比较细致地介绍了什么是GEMM,以及它的优缺点。 阅读全文
posted @ 2021-07-17 14:55 CV技术指南(公众号) 阅读(806) 评论(0) 推荐(0) 编辑
摘要: ​深度学习是一种非常奇怪的技术。几十年来,它的发展轨迹与人工智能的主流完全不同,在少数信徒的努力下得以生存。几年前当我开始使用它时,它让我想起了第一次玩iPhone——感觉我得到了未来送回我们的东西,或者外星人的技术。 其结果之一是,我对它的工程直觉往往是错误的。当我遇到im2col时,根据我对图像 阅读全文
posted @ 2021-07-17 14:52 CV技术指南(公众号) 阅读(141) 评论(0) 推荐(0) 编辑
摘要: ​ 前言: 目标检测的预测框经过了滑动窗口、selective search、RPN、anchor based等一系列生成方法的发展,到18年开始,开始流行anchor free系列,CornerNet算不上第一篇anchor free的论文,但anchor freee的流行却是从CornerNet 阅读全文
posted @ 2021-07-14 09:55 CV技术指南(公众号) 阅读(391) 评论(0) 推荐(0) 编辑
摘要: ​前言: 目标检测是计算机视觉中的一项传统任务。自2015年以来,人们倾向于使用现代深度学习技术来提高目标检测的性能。虽然模型的准确性越来越高,但模型的复杂性也增加了,主要是由于在训练和NMS后处理过程中的各种动态标记。这种复杂性不仅使目标检测模型的实现更加困难,而且也阻碍了它从端到端风格的模型设计 阅读全文
posted @ 2021-07-11 17:11 CV技术指南(公众号) 阅读(320) 评论(0) 推荐(0) 编辑
上一页 1 ··· 36 37 38 39 40 41 42 43 44 ··· 48 下一页