deep learning on object detection
回归工作一周,忙的头晕,看了两三篇文章,主要在写各种文档和走各种办事流程了……
这次来写写object detection最近看的三篇文章吧。都不是最近的文章,但是是今年的文章,我也想借此让自己赶快熟悉起来之前的工作。
首先是google的工作,Speed/accuracy trade-offs for modern convolutional object detectors,下载地址:https://arxiv.org/abs/1611.10012。 11月份的工作,文章工作就如标题一样,我觉得还是有参考价值的。是基于tenseflow的,我没有基于这个平台做检测过。
还有一篇是SSD,Single Shot MultiBox Detector,这篇文章已经出第四版了,发表在ECCV16上的oral,下载地址:http://arxiv.org/abs/1512.02325。11月份出的最新版,看了一下,最新版的实验结果仍然是基于VGG16,根据之前我和作者邮件联系的结果,以及我自己的测试结果,估计在别的模型上结果并没有得到提升吧,这点和上面的工作一致,这个也说明,SSD的调优感觉不容易,按照道理来说,inception v4,v3和resnet101,resnet152的检测结果应该比VGG16好不少的啊。看了作者公开的代码,现在已经可以处理视频数据了,作者也公开了在007上的检测结果,效果看着很酷奥。
第三篇就是rfcn,是微软的工作。R-FCN: Object Detection via Region-based Fully Convolutional Networks,下载地址:https://arxiv.org/abs/1605.06409。他们这两年的工作做得很不错,需要系统学习一下再来说。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人