MMDetection
安装了mmdetection,想跑一下有几篇文章的工作。总觉得发展很快,一转眼几年时间,好多东西都变了。可再仔细看,感觉又没变啥,还是faster rcnn, ssd, yolo等,这几年变化的主要是细节上,除了detr是基于transformer的,其它的都是老思路,只是有些是改变了loss,有些是改变了特征提取层。这些年也在陆续跟进文章,可真的去动手时,还是觉得好像没有前几年的那种速度了,我刚开始做深度学习检测时,从Alex net,到r-cnn,跳跃是完成了特征描述从传统到深度学习的阶段。而后是sppnet和fast r-cnn,其实还是和r-cnn的思路。而后到了faster rcnn,(还记得faster rcnn出来后,我还和同事一起调试过想在网络上直接生成region进行分类和检测的尝试,结果模型训练不下来,就没继续,哎,当时要坚持一下说不定能有点小进步,思路很像SSD或者YOLO,还是想法不成熟,再者能力不够),以及紧接着的ssd和yolo,都完成了完全不依赖任何神经网络之外的算法了,算是完全的end-to-end了。这个过程中,每个过程都感觉是质的飞跃。
当然不是说后来的工作不牛,而是觉得现在大家的工作越做越细了,也意味着越来越难出成果了,没有我可以灌水的地方了,哈哈。
找个方向挖坑吧,感觉工作做得好detail,这种打酱油的水平好难挖出来东西了。
看mmdetection代码的时候,感觉自己给学生上python课讲的太简单了,应该多讲一些,这样自己也能对难度大的理解更深刻,虽然这样可能挂科的人更多。
不像之前caffe和fasterrcnn那样,一堆配置文件,现在是通过config.py类实现的,所有的基本上都是.py文件。而mmdetection,中有很多地方用到了mmcv,而mmcv很多又是调用torch来实现的,mmdetection有些地方也要调用torch。感觉有点绕……mmcv搞这个可能主要是为了分类,就像caffe的角色一样,faster rcnn调用caffe。但是现在是mmcv和torch共同用来起到caffe的作用。还不太明白,反正看到从模型,数据集,到优化器到训练方法,一路是各种config.py文件。反正要想修改,要小心点。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人