OpenCV-Python系列之傅里叶变换

傅里叶变换

我们生活在时间的世界中,早上7:00起来吃早饭,8:00去挤地铁,9:00开始上班。。。以时间为参照就是时域分析。

但是在频域中一切都是静止的!可能有些人无法理解,我建议大家看看这个文章,写的真是相当好,推荐!

https://zhuanlan.zhihu.com/p/19763358

傅里叶变换经常被用来分析不同滤波器的频率特性。我们可以使用 2D 离散傅里叶变换 (DFT) 分析图像的频域特性。实现 DFT 的一个快速算法被称为快速傅里叶变换(FFT)。

对于一个正弦信号,如果它的幅度变化非常快,即f数值比较大,我们可以说他是高频信号,如果变化非常慢,即f数值比较小,我们称之为低频信号。你可以把这种想法应用到图像中,那么我们如何看待图像的变化幅度大小呢?那就是看边界点和噪声,一般边界和噪声是图像中的高频分量(注意这里的高频是指变化非常快,而非出现的次数多)。如果没有如此大的幅度变化我们称之为低频分量。

那么用傅里叶变换进行滤波的优点在哪儿呢,它可以把图像由时域转换成频域,由于频域中的信息更为简单,所以滤波起来更为方便,滤波之后再转换到时域,那么就相当于一个滤波了。

傅里叶变换的作用

· 高频:变化剧烈的灰度分量,例如边界

· 低频:变化缓慢的灰度分量,例如一片大海

所以一般情况下,由于图像中的高频分量与低频分量都存在,我们可以用傅里叶变换进行滤波。

滤波

· 低通滤波器:只保留低频,会使得图像模糊

· 高通滤波器:只保留高频,会使得图像细节增强

我们来看傅里叶变换的函数原型:

dst=cv2.dft(src, dst=None, flags=None, nonzeroRows=None)

第一个参数src为输入图像

dst是输出图像,包括输出图像的大小和尺寸

flags有五种,为转换标志:

1、DFT _INVERSE:执行的是反向的一维或者二维的转换。

2、DFT _SCALE:矩阵的元素数量除以它,产生缩放效果。

3、DFT _COMPLEX_OUTPUT:执行正向转换。

4、DFT _REAL_OUTPUT:执行一维或二维复数阵列的逆变换,结果通常是相同大小的复数数组,但如果输入数组具有共轭复数对称性,则输出为真实数组。

5、DFT _ROWS:执行正向或者反向变换输入矩阵的每个单独的行,该标志可以同时转换多个矢量,并可用于减少开销以执行3D和更高维度的转换等。

nonzeroRows:表示当参数不为零时,函数假定只有nonzeroRows输入数组的第一行(未设置)或者只有输出数组的第一个(设置)包含非零,因此函数可以处理其余的行更有效率,并节省一些时间;这种技术对计算阵列互相关或使用DFT卷积非常有用。

继续来分析傅里叶逆变换函数:

dst = cv2.idft(src[, dst[, flags[, nonzeroRows]]])

src: 表示输入图像,包括实数或复数。

dst: 表示输出图像。

flags: 表示转换标记。

nonzeroRows: 表示要处理的dst行数,其余行的内容未定义。

得到的结果中频率为零的部分会在左上角,通常要转换到中心位置,可以通过np.fft.fftshift()和np.fft.ifftshift()变换来实现,前者是傅里叶变换,后者是傅里叶逆变换。

cv2.dft()返回的结果是双通道(实部、虚部),通常需要转换成图像格式才能展示(0,255),让我们看一下代码:


def dft():
    img = cv2.imread('min.jpg', 0)  # 将图像转换成灰度图
    dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)  # 进行傅里叶变换
    dft_shift = np.fft.fftshift(dft)  # 将频率为零的部分转移到中心位置

    magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))  # 公式

    plt.subplot(121), plt.imshow(img, cmap='gray')
    plt.title('Input Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')
    plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
    plt.show()

image.png

可以看到,中心部分比较亮,越靠近中间位置低频信息越多,而高频信息则都在边界部分。

接下来要想对其进行滤波,应该怎么办呢?

显而易见,既然我们要去除低频分量,那就定一个范围,比如30*30的正方形范围,以图像中心为正方形中心点,将这个范围以内的高亮度的像素点去掉,就完成了滤波,然后我们再使用傅里叶逆变换将图像还原就可以看到。

代码:

def filter():
    img = cv2.imread('min.jpg', 0)
    img_float32 = np.float32(img)
    dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
    dft_shift = np.fft.fftshift(dft)
    rows, cols = img.shape
    crow, ccol = int(rows / 2), int(cols / 2)  # 中心位置
    # 低通滤波
    mask = np.zeros((rows, cols, 2), np.uint8)
    mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1
    # 高通滤波器
    # mask = np.ones((rows, cols, 2), np.uint8)
    # mask[crow-30:crow+30, ccol-30:ccol+30] = 0
    # IDFT
    fshift = dft_shift * mask
    f_ishift = np.fft.ifftshift(fshift)
    img_back = cv2.idft(f_ishift)
    img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])

    plt.subplot(121), plt.imshow(img, cmap='gray')
    plt.title('Input Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(122), plt.imshow(img_back, cmap='gray')
    plt.title('Result'), plt.xticks([]), plt.yticks([])

    plt.show()

低通结果:

image.png

也可以设计高通滤波器将低频部分去除,代码在上面也有,只需修改掩模即可,构建一个掩模,与低频区域对应的地方设置为 0, 与高频区域对应的地方设置为 1。下图为效果图,高通结果:

image.png

可以看到,高通滤波相当于保留了图像的边缘部分,因为边缘部分属于高频信息。

posted @ 2021-12-08 09:04  wuyuan2011woaini  阅读(404)  评论(0编辑  收藏  举报