摘要: 3D视觉算法初学概述 SLAM 是Simultaneous Localization and Mapping的缩写,中文译作“同时定位与地图构建”。它是指搭载特定传感器(单目、双目、RGB-D相机、Lidar)的主体,在没有环境先验信息的情况下,在运动过程中建立环境的模型,同时估计自己的运动。如果这里的传感器主要为相机,那就称为“视觉SLAM”;如果传感器位激光,则为激光 SLAM。 阅读全文
posted @ 2022-12-30 15:37 嵌入式视觉 阅读(1051) 评论(0) 推荐(0) 编辑
摘要: 万字长文解析Scaled YOLOv4模型(YOLO变体模型) Scaled YOLOv4 模型最主要的贡献在于通过理论系统分析和实验证了模型缩放的原则,进一步拓展了 CSPNet 方法,并基于此设计了一个全新的 Scaled-YOLOv4,Scaled-YOLOv4 网络的卷积模块都有使用 CSP。总的感觉就是针对不同的 GPU 平台,根据作者分析出来的模型缩放理论,且符合一些原则的情况下,选择不同的模型宽度和深度参数,并让模型更深更宽。 阅读全文
posted @ 2022-12-29 16:54 嵌入式视觉 阅读(1426) 评论(0) 推荐(0) 编辑
摘要: 万字长文详解 YOLOv1-v5 系列模型 yolov1 作者提出了一种新的目标检测方法 YOLO,之前的目标检测工作都是重新利用分类器来执行检测。作者的神经网络模型是端到端的检测,一次运行即可同时得到所有目标的边界框和类别概率。YOLO 架构的速度是非常快的,base 版本实时帧率为 45 帧,smaller 版本能达到每秒 155 帧,性能由于 DPM 和 R-CNN 等检测方法。 阅读全文
posted @ 2022-12-27 14:36 嵌入式视觉 阅读(845) 评论(0) 推荐(1) 编辑
摘要: 一阶段目标检测网络-RetinaNet详解 作者深入分析了极度不平衡的正负(前景背景)样本比例导致 one-stage 检测器精度低于 two-stage 检测器,基于上述分析,提出了一种简单但是非常实用的 Focal Loss 焦点损失函数,并且 Loss 设计思想可以推广到其他领域,同时针对目标检测领域特定问题,设计了 RetinaNet 网络,结合 Focal Loss 使得 one-stage 检测器在精度上能够达到乃至超过 two-stage 检测器。 阅读全文
posted @ 2022-12-23 20:40 嵌入式视觉 阅读(1134) 评论(0) 推荐(0) 编辑
摘要: 深度学习炼丹-数据增强 在工业界,数据预处理步骤对模型精度的提高的发挥着重要作用。对于机器学习任务来说,广泛的数据预处理一般有四个阶段(视觉任务一般只需 Data Transformation): 数据清洗(Data Cleaning)、数据整合(Data Integration)、数据转换(Data Transformation)和数据缩减(Data Reduction)。 阅读全文
posted @ 2022-12-22 15:18 嵌入式视觉 阅读(916) 评论(0) 推荐(0) 编辑
摘要: 二阶段目标检测网络-Cascade RCNN 详解 Cascade RCNN 是作者 Zhaowei Cai 于 2018 年发表的论文 Cascade R-CNN: Delving into High Quality Object Detection。Cascade R-CNN 来解决 IoU 选择的问题。它由一系列不断增加 IoU 阈值的检测器组成,可以逐步的更接近目标的预测。 阅读全文
posted @ 2022-12-20 16:20 嵌入式视觉 阅读(1793) 评论(0) 推荐(0) 编辑
摘要: 二阶段目标检测网络-Mask RCNN 详解 Mask RCNN 是作者 Kaiming He 于 2018 年发表的论文。Mask RCNN 继承自 Faster RCNN 主要有三个改进: 1,feature map 的提取采用了 FPN 的多尺度特征网络 2,ROI Pooling 改进为 ROI Align 3,在 RPN 后面,增加了采用 FCN 结构的 mask 分割分支。 阅读全文
posted @ 2022-12-19 15:04 嵌入式视觉 阅读(937) 评论(0) 推荐(0) 编辑
摘要: 二阶段目标检测网络-FPN 详解 FPN(feature pyramid networks) 是何凯明等作者提出的适用于多尺度目标检测算法。原来多数的 object detection 算法(比如 faster rcnn)都是只采用顶层特征做预测,但我们知道低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特征做预测,而本文不一样的地方在于预测是在不同特征层独立进行的。 阅读全文
posted @ 2022-12-16 14:14 嵌入式视觉 阅读(2566) 评论(0) 推荐(1) 编辑
摘要: 二阶段目标检测网络-Faster RCNN 详解 backbone 为 vgg16 的 faster rcnn 网络结构如下图所示,可以清晰的看到该网络对于一副任意大小 PxQ 的图像,首先缩放至固定大小 MxN,然后将 MxN 图像送入网络。 阅读全文
posted @ 2022-12-15 19:43 嵌入式视觉 阅读(880) 评论(0) 推荐(0) 编辑
摘要: Python3 编程面试题 在编写程序的时候,如果想要改变(重新赋值)函数外部的变量,并且这个变量会作用于许多函数中,就需要告诉 Python 程序这个变量的作用域是全局变量,global 语句可以实现定义全局变量的作用。 阅读全文
posted @ 2022-12-14 15:05 嵌入式视觉 阅读(207) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示