OpenCV 机器视觉的四大任务
CV的四大任务
-
图像分类(image classification), 检查图像中是否包含某种物体, 或者包含哪些物体.
-
目标检测(Object detection 或 Object localization), 确定目标的位置和类别, 用bounding box圈出具体的位置
-
语义分割 (semantic segmentation) 对图像进行像素级的分类, 预测每个像素属于具体的分类, 但不区分不同的个体, 相连个体会被标记为同一颜色.
-
实体分割(instance segmentation) 比语义分割更进一步, 预测每个像素属于哪个分类, 同时区分不同的个体.
算法
- 图像相关神经网络算法的发展历史:Lenet -> Alexnet -> ZFnet -> VGG -> NIN -> googleNet -> ResNet -> DenseNet -> Resnext -> EfficientNet
- 目标检测算法包括: 基于区域的方法、单阶段检测、双阶段检测。其中单阶段最有名为 Yolo 系列. 双阶段包括 R-CNN, Fast R-CNN Faster R-CNN, Mask R-CNN, SPP-net , 双阶段是将物体识别和定位分到两个步骤完成, 特点是:错误率低, 但因为网络结构参数多, 计算量大导致检测速度慢, 不能满足实时场景. 单阶段是一个阶段即标识出物体类别和坐标, 识别速度快, Yolo系列准确率也已经基本达到faster R-CNN的水平.
参考:
https://cloud.tencent.com/developer/article/2322720
https://blog.csdn.net/weixin_44097477/article/details/123525344