OpenCV---图像梯度
图像梯度
推文:【OpenCV入门教程之十二】OpenCV边缘检测:Canny算子,Sobel算子,Laplace算子,Scharr滤波器合辑
图像梯度可以把图像看成二维离散函数,图像梯度其实就是这个二维离散函数的求导。
Sobel算子是普通一阶差分,是基于寻找梯度强度。
拉普拉斯算子(二阶差分)是基于过零点检测。通过计算梯度,设置阀值,得到边缘图像。
一:sobel算子
def sobel_demo(image): grad_x = cv.Sobel(image,cv.CV_32F,1,0) #获取x轴方向的梯度,对x求一阶导,一般图像都是256,CV_8U但是由于需要进行计算,为了避免溢出,所以我们选择CV_32F grad_y = cv.Sobel(image, cv.CV_32F, 0,1) # 获取y轴方向的梯度,对y求一阶导 gradx = cv.convertScaleAbs(grad_x) #用convertScaleAbs()函数将其转回原来的uint8形式,转绝对值 (转为单通道,0-255) grady = cv.convertScaleAbs(grad_y) cv.imshow("gradient-x",gradx) cv.imshow("gradient-y",grady) gradxy = cv.addWeighted(gradx,0.5,grady,0.5,0) #图片融合 cv.imshow("gradient",gradxy)
补充:在sobel算子的基础上还有一种Scharr算子,可以获取更强的边缘检测(噪声比较敏感,需要降噪)
grad_x = cv.Scharr(image,cv.CV_32F,1,0) #获取x轴方向的梯度,对x求一阶导,一般图像都是256,CV_8U但是由于需要进行计算,为了避免溢出,所以我们选择CV_32F grad_y = cv.Scharr(image, cv.CV_32F, 0,1) # 获取y轴方向的梯度,对y求一阶导
相关知识补充:
(一)Sobel算子
Sobel算子用来计算图像灰度函数的近似梯度。Sobel算子根据像素点上下、左右邻点灰度加权差,在边缘处达到极值这一现象检测边缘。对噪声具有平滑作用,提供较为精确的边缘方向信息,边缘定位精度不够高。当对精度要求不是很高时,是一种较为常用的边缘检测方法。
Sobel具有平滑和微分的功效。即:Sobel算子先将图像横向或纵向平滑,然后再纵向或横向差分,得到的结果是平滑后的差分结果。
def Sobel(src, ddepth, dx, dy, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src参数表示输入需要处理的图像。 ddepth参数表示输出图像深度,针对不同的输入图像,输出目标图像有不同的深度。 具体组合如下: src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源图像都为CV_8U,为了避免溢出,一般ddepth参数选择CV_32F) src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_64F, 取ddepth = -1/CV_64F 注:ddepth =-1时,代表输出图像与输入图像相同的深度。 dx参数表示x方向上的差分阶数,1或0 。 dy参数表示y 方向上的差分阶数,1或0 。 dst参数表示输出与src相同大小和相同通道数的图像。 ksize参数表示Sobel算子的大小,必须为1、3、5、7。 scale参数表示缩放导数的比例常数,默认情况下没有伸缩系数。 delta参数表示一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中。 borderType表示判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。
(二)convertScaleAbs
def convertScaleAbs(src, dst=None, alpha=None, beta=None): # real signature unknown; restored from __doc__
OpenCV的convertScaleAbs函数使用线性变换转换输入数组元素成8位无符号整型。函数原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst src参数表示原数组。 dst参数表示输出数组 (深度为 8u)。 alpha参数表示比例因子。 beta参数表示原数组元素按比例缩放后添加的值。
(三)addWeighted
def addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None): # real signature unknown; restored from __doc__
OpenCV的addWeighted函数是计算两个数组的加权和。函数原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst src1参数表示需要加权的第一个输入数组。 alpha参数表示第一个数组的权重。 src2参数表示第二个输入数组,它和第一个数组拥有相同的尺寸和通道数。 beta参数表示第二个数组的权重。 gamma参数表示一个加到权重总和上的标量值。 dst参数表示输出的数组,它和输入的两个数组拥有相同的尺寸和通道数。 dtype参数表示输出数组的可选深度。当两个输入数组具有相同的深度时,这个参数设置为-1(默认值),即等同于src1.depth()。
二:拉普拉斯算子
def lapalian_demo(image): dst = cv.Laplacian(image, cv.CV_32F) lpls = cv.convertScaleAbs(dst) cv.imshow("lapalian_demo", lpls)
补充:自己修改拉普拉斯算子
def lapalian_demo(image): kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]]) #卷积核 dst = cv.filter2D(image,cv.CV_32F,kernel) #使用4卷积核算子去处理(是Laplacian默认) lpls = cv.convertScaleAbs(dst) cv.imshow("lapalian_demo", lpls)
kernel = np.array([[1,1,1],[1,-8,1],[1,1,1]]) #使用8卷积核处理,增强了
相关知识补充
(一)Laplacian方法
def Laplacian(src, ddepth, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src参数表示输入需要处理的图像。 ddepth参数表示输出图像深度,针对不同的输入图像,输出目标图像有不同的深度。 具体组合如下: src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源图像都为CV_8U,为了避免溢出,一般ddepth参数选择CV_32F) src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_64F, 取ddepth = -1/CV_64F 注:ddepth =-1时,代表输出图像与输入图像相同的深度。 dst参数表示输出与src相同大小和相同通道数的图像。 ksize参数表示用于计算二阶导数滤波器的孔径大小,大小必须是正数和奇数。,可以通过修改ksize大小来修改算子,ksize默认是1,为4卷积核,3是8卷积核,可以向上加,边缘梯度检测越明显 scale参数表示计算拉普拉斯算子值的比例因子,默认情况下没有伸缩系数。 delta参数表示一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中。 borderType表示判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。