图像模板匹配
一、概念
局部图片 在 完整图片的哪个位置(最像)
OpenCV 会从左到右,从上到下,一点点匹配,查看差异值;
模板匹配和卷积原理很像,模板在原图像上从原点开始滑动,计算模板与(图像被模板覆盖的地方)的差别程度,这个差别程度的计算方法在opencv里有6种。
将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是AxB大小,而模板是axb大小,则输出结果的矩阵是(A-a+1)x(B-b+1)
匹配模式
- TM_SQDIFF: 计算平方不同,计算出来的值越小,越相关
- TM_CCORR: 计算相关性,计算出来的值越大,越相关
- TM_CCOEFF: 计算相关系数,计算出来的值越大,越相关
- TM_SQDIFF_NORMED: 计算归一化平方不同,计算出来的值越接近0,越相关
- TM_CCORR_NORMED: 计算归-化相关性,计算出来的值越接近1,越相关
- TM_CCOEFF_NORMED: 计算归-化相关系数,计算出来的值越接近1,越相关
实现
import cv2
import numpy as np
import matplotlib.pyplot as plt
umb = cv2.imread('umb.jpg')
template = cv2.imread('cloud.jpg')
h, w = template.shape[:2]
template.shape # (105, 135, 3)
umb.shape # (640, 640, 3)
# 匹配
res = cv2.matchTemplate(umb, template, 1)
# 假如原图形是 AxB 大小,而模板是 axb 大小,则输出结果的矩阵是(A-a+1)x(B-b+1)
res.shape # (536, 506)
# 设置不同的方法,来观察
methods = ['cv2.TM_CCOEFF', 'cv2.TM_CCOEFF_NORMED' , 'cv2.TM_CCORR' , 'cv2.TM_CCORR_NORMED' , 'cv2.TM_SQDIFF' , 'cv2.TM_SQDIFF_NORMED']
# minMaxLoc 用来定位
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
min_val, max_val, min_loc, max_loc
# (0.0002330602437723428, 0.17726679146289825, (504, 404), (299, 99))
# 越小的值,像素的差异越小;可尽量使用归一化(后缀有 _NORMED)的结果
for meth in methods:
img2 = umb.copy()
method = eval(meth)
print(method)
res = cv2.matchTemplate(umb, template, 1)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
if method in [cv2.TM_SQDIFF, cv2.TM_SQDIFF_NORMED]:
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
# 画矩形
cv2.rectangle(img2, top_left, bottom_right, 255, 2)
plt.subplot(121), plt.imshow(res, cmap='gray')
# 隐藏坐标轴
plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img2, cmap='gray')
# 隐藏坐标轴
plt.xticks([]), plt.yticks([])
plt.suptitle(meth)
plt.show()
匹配多个对象
不是选择一个最小或最大的,而是自己去选择一个合适的范围值
back = cv2.imread('umb.jpg')
h, w = template.shape[::2]
res = cv2.matchTemplate(back, template, cv2.TM_CCOEFF_NORMED)
threshold = 0.2
# 取匹配程度大于 0.8 的坐标
loc = np.where(res >= threshold)
for pt in zip(*loc[::-1]): # * 表示可选参数
bottom_right = (pt[0] + w, pt[1] + h )
cv2.rectangle(back, pt, bottom_right, (0,255,0), 2)
plt.imshow(back)