深度学习——计算机视觉的相关问题
计算机视觉的相关问题
1. Image Classification (图像分类)
所谓图像分类问题,就是对于输入的图像,从已有固定的分类标签集合中找出一个分类标签分配给该输入图像。
目标识别用到了图像分类。
2. Object Recognition (物体识别)
- 给定一张图片
- 检索出图片中所有的目标(目标类别受限于训练集中已有物体的类别,无法检测出训练集中没有的目标)
- 用矩形框将检索到的目标进行框定,并对矩形框中的目标进行分类(给一个出分类标签)
小结:目标识别就是检测出给定图片中所有可以识别到的目标对象,并用矩形框在图片中框出,再给出一个分类标签。
3.Object Segmentation (物体分割)
- 于Object Recognition 类似,检测到图像中的所有的目标
- 区别是像素级,需要给出每个目标 (类) 的所有像素点,而不是矩形框
4. Object Detection(物体检测)
- 与Object Recogenition类似
- 区别在于只有两个类别,目标类和非目标类
- 如果给定图像中有目标类,则需要用矩形框将目标类框定
5. Image Segmentation (图像分割)
- 将给定的图像分割为若干个区域
- 每个区域为一个类,但不需要给出标签
6. Semantic Segmentation(语义分割)
- 需要对图像的每一个像素点进行分类
- 需要对图像中的每一个像素点进行分割,而不仅仅是用矩形框进行框定,但是同一类别的不同实例不需要加以区分(如下图中的汽车)。
7. Instance Segmentation(实例分割)
- 需要对图像中的每一个像素进行分类
- 和语义分割的区别在于,要对同一类别的不同实例加以区分。