09 2024 档案

摘要:SEA-RAFT: Simple, Efficient, Accurate RAFT for Optical FlowYihan Wang, Lahav Lipson, and Jia Deng 一种比RAFT更简单、有效、准确率高的光流算法,比起来RAFT, sea-raft训练时用了一种新的lo 阅读全文
posted @ 2024-09-26 20:53 deeplearner_allen 阅读(210) 评论(0) 推荐(0) 编辑
摘要:A Survey on Self-supervised Learning: Algorithms, Applications, and Future TrendsJie Gui, Senior Member, IEEE, Tuo Chen, Jing 自监督学习,在google scholar上检索 阅读全文
posted @ 2024-09-23 21:19 deeplearner_allen 阅读(57) 评论(0) 推荐(0) 编辑
摘要:self supervised learning 自监督学习,按照机器学习中传统分类方法,监督学习,无监督学习,强化学习,有些还会有半监督学习等。 监督学习,以计算机视觉领域中最简单的任务为例,给你一张只有一只狗的图,让你说这图是什么,你肯定说是狗。那么在计算机视觉任务重,给这图打的标签一般就是do 阅读全文
posted @ 2024-09-22 20:19 deeplearner_allen 阅读(39) 评论(0) 推荐(0) 编辑
摘要:paper Metric3D v2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation 作者 Mu Hu1∗, Wei Yin2∗†, C 阅读全文
posted @ 2024-09-22 20:07 deeplearner_allen 阅读(331) 评论(0) 推荐(0) 编辑
摘要:我一直好奇的是为啥要做这个? 排了好多照片,然后重建一下,既然都拍照片了,就不能录像吗?为啥要做3d重建呢? 阅读全文
posted @ 2024-09-13 21:07 deeplearner_allen 阅读(17) 评论(0) 推荐(0) 编辑
摘要:最近在开始新的领域,三维重建,其实是想做adas领域的4d label相关的工作。无奈啊,对computer graphics的东西,我一向很排斥,然后现在不得已要面对了。 首先推荐一本书,Multiple View Geometry in Computer Vision (Second Editi 阅读全文
posted @ 2024-09-13 21:02 deeplearner_allen 阅读(582) 评论(0) 推荐(0) 编辑
摘要:最近在看4dlable的生成工作。 涉及到渲染,computer graphic的东西,好多新东西,mark一下,回头来补。 先记录一下很多地方出现的烦人的麻烦。 1.首先是pymeshlab,这个第三方库目前官方明确表示没有验证过conda环境的安装,建议在conda外部安装,外部安装是可以成功的 阅读全文
posted @ 2024-09-10 20:46 deeplearner_allen 阅读(34) 评论(0) 推荐(0) 编辑
摘要:最近读一些端到端的文章,发现一个问题,现在所谓的端到端,其实远远没有端到端。 从最开始的传感器端到端,这样做有两个好处,1.把跟踪和检测合为一体。2.把后处理的很多tricks拿到模型上来做了,感知模型实际输出就是物体的世界坐标位置。这种文章又分两个大方向,一个是密集dense类型的,比如bevfo 阅读全文
posted @ 2024-09-10 20:41 deeplearner_allen 阅读(56) 评论(0) 推荐(0) 编辑
摘要:在工作过程中,我们训练模型时,到底是哪些因素影响最大?模型深度,模型宽度,head个数,head深度,输入大小,输出大小等等。 在工业界中,基于深度学习的检测模型尤其应用广泛。今年由于工作变动,接触了各种不同的项目和模型。发现一个规律,模型可以很小,但是数据量很大时,一样能提高效果。同时输入尺寸变大 阅读全文
posted @ 2024-09-10 20:27 deeplearner_allen 阅读(247) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示