3D目标检测读后感(一)

今天看了一篇文章Automatic Camera Calibration for Traffific Understanding

Automatic Camera Calibration for Traffic Understanding [BMVC 2014]_哔哩哔哩_bilibili

只有短短一页内容,但是从视频来看,方法很实用。

大致是解决了交通监控的3d检测框问题。第一步,是求解了图像中每个点的绝对坐标系方向,作者称为确定车辆流的3个消失正交点。消失点指的是视觉相交点,透视图中的概念。

第二步,是构建3D目标检测框,从blob区域与每个点的切线方向开始构建。文章中作者没有说明如何求取切线,我认为应该是利用了sobel算子来求切线。

作者只写了短短一页纸,要讲清所有内容是不现实的,一些重要的细节根本没说,只能留给读者无限的遐想,想要复现该算法几乎不可能。

 

又看了他的文章BoxCars: Improving Fine-Grained Recognition of Vehicles using 3D Bounding Boxes in Traffific Surveillance

这次有源码。顺应时代发展,作者提出了一些基于深度学习求解三个消失点的方法。他认为,3D检测的关键就是求解三个消失点。一些细节部分还是写的很简略。

第三章中的D节,他利用CNN求解消失点方向,然后结合车辆轮廓来求解3D检测框,就像他上一篇文章做的一样。

posted @   澳大利亚树袋熊  阅读(126)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
点击右上角即可分享
微信分享提示