一种实用性较强的求IOU的算法(任意多边形之间的IOU)
PS:要转载请注明出处,本人版权所有。
PS: 这个只是基于《我自己》的理解,
如果和你的原则及想法相冲突,请谅解,勿喷。
前置说明
本文作为本人csdn blog的主站的备份。(BlogID=115)
环境说明
无
前言
提到IOU,如果接触过目标检测,应该是很熟悉的,这个东西简直就是标配了。但是我之前见到的求IOU都是求两个矩形的IOU,由于矩形的特殊性,其IOU可以很简单的求。
突然有一天,我要求一个矩形和一个多边形的IOU,这就让我突然有点懵,参考原来求两个矩形的IOU方式,完全无解。经过了询问大佬以及网上冲浪后,在某不起眼的地方发现了一个思路,一个匿名网友貌似提供了一句MATLAB的代码,给了我不错的启发。
因此本文用c++和opencv实现了这部分代码。下面将会从IOU概念,两矩形的IOU,以及任意多边形之间的IOU顺序进行讲解。
交并比(Intersection of Union,IOU)
我们定义一个多边形的面积为Area0,另外一个多边形的面积为Area1。那么IOU的数学定义为。
下面我们用一个示例图清晰的表达这个概念:

其中B类区域就是两个多边形的交集。IOU求的是B类区域在A,B,C类区域中的占比。注意这里是占比。
两个矩形之间的IOU求法
两个矩形的IOU求法其实交简单,根据一些性质,我们可以直接求出交集区域的宽和高,然后直接得到交集面积即可,这些都是常规写法。详情见如下代码:
float IOU(const cv::Rect &r0, const cv::Rect &r1)
{
if (r0.x > r1.x + r1.width) return 0.f;//top-x r0 在r1右边
if (r0.y > r1.y + r1.height) return 0.f;//top-y r0 在r1下边
if (r0.x + r0.width < r1.x) return 0.f;//bottom-x r0 在r1左边
if (r0.y + r0.height < r1.y) return 0.f;//bottom-y r0 在r1上边
// 此时必定相交
float _overlap_w = std::min(r0.x + r0.width, r1.x + r1.width) - std::max(r0.x, r1.x);//得到相交矩形w
float _overlap_h = std::min(r0.y + r0.height, r1.y + r1.height) - std::max(r0.y, r1.y);//得到相交矩形h
// maybe overflow
return (_overlap_w * _overlap_h)/(float)((r0.width*r0.height) + (r1.width*r1.height));
}
如上可知,可以直接根据相关面积,求出IOU。
两个多边形之间的IOU求法
我们需要求两个多边形的IOU,这个时候我们根据两个矩形的思路想想,貌似不好弄。这个时候我们可以转变一下思路。
我们首先肯定是知道两个多边形的最大外接矩形的,这个时候我们得到最大的外界矩形宽和高(注意,这里的宽和高一般是固定的,所以一般我们都不需要去求外接矩)。然后我们创建三个宽和高等于我们预设的一维矩阵M_A, M_B,M_C,并将其所有元素置为0。这个时候,我们分别将矩阵一用多边形P1来来填充M_A,在P1内的元素置为1,外的元素不变。对M_B用同样的方式去填充。这个时候我们去计算M_C,具体计算方法是将对应的M_A,M_B同一位置的元素相与后赋值给M_C(表达式为:)。这个时候我们去统计M_A,M_B,M_C中1的个数,其实就得到了对应的面积(也可以叫做像素面积),这个时候我们就可以方便的求出IOU,值得注意的是opencv中提供了我们所需要的所有操作。
下面我们用c++来实现以上的流程(注意,以下代码是实现的是N个多边形和M个多边形的IOU,若自己的需求不一样,请修改为对应的场景,代码是随手写的,未仔细验证,原理是这样的)。
float IoU(const std::vector<std::vector<cv::Point>> &poly_array0, const std::vector<std::vector<cv::Point>> &poly_array1, int max_w, int max_h){
cv::Mat _poly0 = cv::Mat::zeros(max_h, max_w, CV_8UC1);
cv::Mat _poly1 = cv::Mat::zeros(max_h, max_w, CV_8UC1);
cv::Mat _result;
std::vector<cv::Point *> _pts0;
std::vector<int> _npts0;
for(auto &_v:poly_array0){
if (_v.size() < 3)//invalid poly
return -1.f;
_pts0.push_back((cv::Point *)&_v[0]);
_npts0.push_back((int)_v.size());
}
std::vector<cv::Point *> _pts1;
std::vector<int> _npts1;
for(auto &_v:poly_array1){
if (_v.size() < 3)//invalid poly
return -1.f;
_pts1.push_back((cv::Point *)&_v[0]);
_npts1.push_back((int)_v.size());
}
/*
void cv::fillPoly ( Mat & img,
const Point ** pts,
const int * npts,
int ncontours,
const Scalar & color,
int lineType = LINE_8,
int shift = 0,
Point offset = Point()
)
*/
cv::fillPoly(_poly0, (const cv::Point **)&_pts0[0], &_npts0[0], _npts0.size(), cv::Scalar(1));
cv::fillPoly(_poly0, (const cv::Point **)&_pts1[0], &_npts1[0], _npts1.size(), cv::Scalar(1));
cv::bitwise_and(_poly0, _poly1, _result);
int _area0 = cv::countNonZero(_poly0);
int _area1 = cv::countNonZero(_poly1);
int _intersection_area = cv::countNonZero(_result);
// float _iou = (float)_intersection_area/(float)(_area0 + _area1 - _intersection_area);
float _iou = (float)_intersection_area/(float)_area1;
return _iou;
}
通过如上代码,我们用opencv就实现了我们预想的效果。
后记
注意,这里需要延伸一点,求IOU,我们一般是用交集除以并集,但是有些时候,可能我们会用交集除以其中一个集合。比如:一个小矩形,一个大多边形的iou,其实按照标准写法来看,iou的数值不处理的话,不是那么可爱的。
其实这里的几种用法还可以延伸出来,比如算两个立方体的重合度等等。
参考文献

PS: 请尊重原创,不喜勿喷。
PS: 要转载请注明出处,本人版权所有。
PS: 有问题请留言,看到后我会第一时间回复。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)