图像分割的基础知识
一、分割的基本了解
- 图像分割是一个定义不明确问题(ill defined),一副图像的最有分割结果往往是根据实际的应用任务而确定的。现有的图像算法,也是针对某一个具体的应用而设计的。图像分割理论没有实质性的突破,所以,没有通用的分割理论。
- 主要的研究方向是:
- 交互式分割:是否需要用户交互。主流的有两种方案:
- 基于边界(boundary)的交互方式。用户画出一条大致的边界曲线。算法就是优化这条曲线,逼近物体边界。代表算法是snake算法。
- 基于种子(seed)的交互方式。用户只需要在前景或者背景区域粗略地标记一些种子点,通常是鼠标点击的区域,标记为种子区域,分割出前景物体。代表算法是Graph Cut算法。
- 特定类图像分割
- 语义图像分割:分割出图像中的物体并识别出它们的类别。场景理解。
- 协同图像分割:协同分割的典型定义是指根据一组给定的图像集共同分割出其中“相似的东西”。
- 交互式分割:是否需要用户交互。主流的有两种方案:
二、测地距离(geodesic distance)
测地距离是地理上的概念,就是地球表面的两点的最短距离。显然,和欧几里德距离(Euclidean distance)还是有区别的。后来这个概念被推广到数学空间,例如在图论中,测地距离就是图中两个节点之间的最短距离。如下图,\(d_{15}\)是欧氏距离,\(d_{12}+d_{23}+d_{34}+d_{45}\)是测地距离。
三、图论分割算法基本原理
一幅图像可以被映射成一个加权的无向图,其中像素点被当作图中的顶点,而相邻的像素之间的视觉性质(比如灰度级别,颜色或者纹理)的相似度当作相应的边的权值,于是图像的分割结果就可以通过对图的分割处理来获得。
把每个像素点认为成图的顶点,图的每个顶点(除边界点外)有四个邻接顶点,邻接顶点之间两两相连接,边长有权重,比如直接用像素值的差值。这里不采用简单的欧氏距离,相邻像素点的欧氏距离是1。
四、基于测地距离的交互式分割算法流程
- 给定一张有待分割的图片,算法根据图论分割算法的基本原理,生成一张对应的距离图。
- 用户在相应的前景和背景区域标记seed点。
- 计算全图未标记点到前景seed点的测地距离\(d_1\),背景seed点的测地距离\(d_2\)。
- 对于全图的所有点进行判断是前景fg还是背景bg:\[P_{fg}(x) = \frac{d_2(x)}{d_1(x)+d_2(x)}, P_{bg}(x) = \frac{d_1(x)}{d_1(x)+d_2(x)} \]如果\(P_{fg}(x)>P_{bg}(x)\),则是前景,否则为背景。
主要参考:
几何特征系列:Average Geodesic Distance(平均测地距离)
[1]孙鹏. 交互式图像分割和语义图像分割算法的研究[D].燕山大学,2014.