摘要: 人是习惯性动物,当我们第一次用opencv时,肯定会觉得opencv的imread()方式很奇怪,做图像出来天天说图像是RGB图RGB图,可opencv读出来的图,却是BGR的顺序。是不是很奇怪,还不止这一点,opencv读进来的图,你在使用shape函数时,返回的是h,w,c,也就是height是 阅读全文
posted @ 2024-12-15 12:57 deeplearner_allen 阅读(111) 评论(0) 推荐(1) 编辑
摘要: 3DRealCar:An In-the-wild RGB-D Car Dataset with 360-degree Views Du, Xiaobiao and Sun, Haiyang and Wang, Shuyun and Wu, Zhuojie and Sheng, Hongwei and 阅读全文
posted @ 2024-10-15 21:23 deeplearner_allen 阅读(62) 评论(0) 推荐(0) 编辑
摘要: SEA-RAFT: Simple, Efficient, Accurate RAFT for Optical FlowYihan Wang, Lahav Lipson, and Jia Deng 一种比RAFT更简单、有效、准确率高的光流算法,比起来RAFT, sea-raft训练时用了一种新的lo 阅读全文
posted @ 2024-09-26 20:53 deeplearner_allen 阅读(186) 评论(0) 推荐(0) 编辑
摘要: A Survey on Self-supervised Learning: Algorithms, Applications, and Future TrendsJie Gui, Senior Member, IEEE, Tuo Chen, Jing 自监督学习,在google scholar上检索 阅读全文
posted @ 2024-09-23 21:19 deeplearner_allen 阅读(47) 评论(0) 推荐(0) 编辑
摘要: self supervised learning 自监督学习,按照机器学习中传统分类方法,监督学习,无监督学习,强化学习,有些还会有半监督学习等。 监督学习,以计算机视觉领域中最简单的任务为例,给你一张只有一只狗的图,让你说这图是什么,你肯定说是狗。那么在计算机视觉任务重,给这图打的标签一般就是do 阅读全文
posted @ 2024-09-22 20:19 deeplearner_allen 阅读(35) 评论(0) 推荐(0) 编辑
摘要: paper Metric3D v2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation 作者 Mu Hu1∗, Wei Yin2∗†, C 阅读全文
posted @ 2024-09-22 20:07 deeplearner_allen 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 我一直好奇的是为啥要做这个? 排了好多照片,然后重建一下,既然都拍照片了,就不能录像吗?为啥要做3d重建呢? 阅读全文
posted @ 2024-09-13 21:07 deeplearner_allen 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 最近在开始新的领域,三维重建,其实是想做adas领域的4d label相关的工作。无奈啊,对computer graphics的东西,我一向很排斥,然后现在不得已要面对了。 首先推荐一本书,Multiple View Geometry in Computer Vision (Second Editi 阅读全文
posted @ 2024-09-13 21:02 deeplearner_allen 阅读(527) 评论(0) 推荐(0) 编辑
摘要: 最近在看4dlable的生成工作。 涉及到渲染,computer graphic的东西,好多新东西,mark一下,回头来补。 先记录一下很多地方出现的烦人的麻烦。 1.首先是pymeshlab,这个第三方库目前官方明确表示没有验证过conda环境的安装,建议在conda外部安装,外部安装是可以成功的 阅读全文
posted @ 2024-09-10 20:46 deeplearner_allen 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 最近读一些端到端的文章,发现一个问题,现在所谓的端到端,其实远远没有端到端。 从最开始的传感器端到端,这样做有两个好处,1.把跟踪和检测合为一体。2.把后处理的很多tricks拿到模型上来做了,感知模型实际输出就是物体的世界坐标位置。这种文章又分两个大方向,一个是密集dense类型的,比如bevfo 阅读全文
posted @ 2024-09-10 20:41 deeplearner_allen 阅读(55) 评论(0) 推荐(0) 编辑