从傅里叶变换到小波变换,并不是一个完全抽象的东西,可以讲得很形象。小波变换有着明确的物理意义,如果我们从它的提出时所面对的问题看起,可以整理出非常清晰的思路。
下面我就按照傅里叶-->短时傅里叶变换-->小波变换的顺序,讲一下为什么会出现小波这个东西、小波究竟是怎样的思路。(反正题主要求的是通俗形象,没说简短,希望不会太长不看。。)
一、傅里叶变换 关于傅里叶变换的基本概念在此我就不再赘述了,默认大家现在正处在理解了傅里叶但还没理解小波的道路上。(在第三节小波变换的地方我会再形象地讲一下傅里叶变换)
下面我们主要将傅里叶变换的
不足。 即我们知道傅里叶变化可以分析信号的频谱,那么为什么还要提出小波变换?答案就是
方沁园 所说的,“对
非*稳 过程,傅里叶变换有局限性”。看如下一个简单的信号:
<img src="https://pic1.zhimg.com/da6c4b8ce1672d4997000eb08444824c_b.jpg" data-rawwidth="597" data-rawheight="284" class="origin_image zh-lightbox-thumb" width="597" data-original="https://pic1.zhimg.com/da6c4b8ce1672d4997000eb08444824c_r.jpg">做完FFT(快速傅里叶变换)后,可以在频谱上看到清晰的四条线,信号包含四个频率成分。
做完FFT(快速傅里叶变换)后,可以在频谱上看到清晰的四条线,信号包含四个频率成分。
一切没有问题。但是,如果是
频率随着时间变化的非*稳信号 呢?
<img src="https://pic1.zhimg.com/def600cea95fa10e3872e88dc8059d6c_b.jpg" data-rawwidth="690" data-rawheight="612" class="origin_image zh-lightbox-thumb" width="690" data-original="https://pic1.zhimg.com/def600cea95fa10e3872e88dc8059d6c_r.jpg">
如上图,最上边的是频率始终不变的*稳信号。而下边两个则是频率随着时间改变的非*稳信号 ,它们同样包含和最上信号相同频率的四个成分。 做FFT后,我们发现这三个时域上有巨大差异的信号,频谱(幅值谱)却非常一致。尤其是下边两个非*稳信号,我们从频谱上无法区分它们,因为它们包含的四个频率的信号的成分确实是一样的,只是出现的先后顺序不同。
可见,傅里叶变换处理非*稳信号有天生缺陷 。它只能获取一段信号总体上 包含哪些频率的成分 ,但是对各成分出现的时刻并无所知 。 因此时域相差很大的两个信号,可能频谱图一样。
然而*稳信号大多是人为制造出来的,自然界的大量信号几乎都是非*稳的,所以在比如生物医学信号分析等领域的论文中,基本看不到单纯傅里叶变换这样naive的方法。
<img src="https://pic3.zhimg.com/e71310fc73e7beba589b76264564abee_b.jpg" data-rawwidth="429" data-rawheight="287" class="origin_image zh-lightbox-thumb" width="429" data-original="https://pic3.zhimg.com/e71310fc73e7beba589b76264564abee_r.jpg">上图所示的是一个正常人的事件相关电位。对于这样的非*稳信号,只知道包含哪些频率成分是不够的,我们还想知道
上图所示的是一个正常人的事件相关电位。对于这样的非*稳信号,只知道包含哪些频率成分是不够的,我们还想知道各个成分出现的时间 。知道信号频率随时间变化的情况 ,各个时刻的瞬时频率及其幅值——这也就是时频分析。
二、短时傅里叶变换(Short-time Fourier Transform, STFT)
一个简单可行的方法就是——
加窗 。我又要套用
方沁园 同学的描述了,“把整个时域过程分解成无数个等长的小过程,每个小过程*似*稳,再傅里叶变换,就知道在哪个时间点上出现了什么频率了。”这就是短时傅里叶变换。
看图:
<img src="https://pic3.zhimg.com/7f4ac3c30283e657406d6661300478a2_b.jpg" data-rawwidth="844" data-rawheight="449" class="origin_image zh-lightbox-thumb" width="844" data-original="https://pic3.zhimg.com/7f4ac3c30283e657406d6661300478a2_r.jpg">时域上分成一段一段做FFT,不就知道频率成分随着时间的变化情况了吗! 时域上分成一段一段做FFT,不就知道频率成分随着时间的变化情况了吗!
用这样的方法,可以得到一个信号的时频图了:
<img src="https://pic1.zhimg.com/fec492fbcf67ddde4cb6017b62497bf4_b.jpg" data-rawwidth="649" data-rawheight="492" class="origin_image zh-lightbox-thumb" width="649" data-original="https://pic1.zhimg.com/fec492fbcf67ddde4cb6017b62497bf4_r.jpg"> ——此图像来源于“THE WAVELET TUTORIAL”
——此图像来源于“THE WAVELET TUTORIAL” 图上既能看到10Hz, 25 Hz, 50 Hz, 100 Hz四个频域成分,还能看到出现的时间。两排峰是对称的,所以大家只用看一排就行了。
是不是棒棒的?时频分析结果到手。但是STFT依然有缺陷。
使用STFT存在一个问题,我们应该用多宽的窗函数?
窗太宽太窄都有问题:
<img src="https://pic4.zhimg.com/479dd3f809656bf154456868b65e73b3_b.jpg" data-rawwidth="627" data-rawheight="312" class="origin_image zh-lightbox-thumb" width="627" data-original="https://pic4.zhimg.com/479dd3f809656bf154456868b65e73b3_r.jpg"> <img src="https://pic3.zhimg.com/9da6c3e9704c32bfb7b53b995532878e_b.jpg" data-rawwidth="609" data-rawheight="350" class="origin_image zh-lightbox-thumb" width="609" data-original="https://pic3.zhimg.com/9da6c3e9704c32bfb7b53b995532878e_r.jpg">窗太窄,窗内的信号太短,会导致频率分析不够精准,频率分辨率差。窗太宽,时域上又不够精细,时间分辨率低。
窗太窄,窗内的信号太短,会导致频率分析不够精准,频率分辨率差。窗太宽,时域上又不够精细,时间分辨率低。 (这里插一句,这个道理可以用海森堡不确定性原理来解释。类似于我们不能同时获取一个粒子的动量和位置,我们也不能同时获取信号绝对精准的时刻和频率。这也是一对不可兼得的矛盾体。我们不知道在某个瞬间哪个频率分量存在,我们知道的只能是在一个时间段内某个频带的分量存在。 所以绝对意义的瞬时频率是不存在的。)
看看实例效果吧:
<img src="https://pic1.zhimg.com/565a3c57d43c8f2f78a5b1dc0de66e34_b.jpg" data-rawwidth="608" data-rawheight="292" class="origin_image zh-lightbox-thumb" width="608" data-original="https://pic1.zhimg.com/565a3c57d43c8f2f78a5b1dc0de66e34_r.jpg"> <img src="https://pic3.zhimg.com/c7d2d230a8c4766569c5a77fac901eea_b.jpg" data-rawwidth="604" data-rawheight="295" class="origin_image zh-lightbox-thumb" width="604" data-original="https://pic3.zhimg.com/c7d2d230a8c4766569c5a77fac901eea_r.jpg"> <img src="https://pic2.zhimg.com/39822d6589c4486a0a91a148e0a3e571_b.jpg" data-rawwidth="614" data-rawheight="281" class="origin_image zh-lightbox-thumb" width="614" data-original="https://pic2.zhimg.com/39822d6589c4486a0a91a148e0a3e571_r.jpg"> ——此图像来源于“THE WAVELET TUTORIAL”
——此图像来源于“THE WAVELET TUTORIAL” 上图对同一个信号(4个频率成分)采用不同宽度的窗做STFT,结果如右图。用窄窗,时频图在时间轴上分辨率很高,几个峰基本成矩形,而用宽窗则变成了绵延的矮山。但是频率轴上,窄窗明显不如下边两个宽窗精确。
所以窄窗口时间分辨率高、频率分辨率低 ,宽窗口时间分辨率低、频率分辨率高 。对于时变的非稳态信号,高频适合小窗口,低频适合大窗口 。然而STFT的窗口是固定的 ,在一次STFT中宽度不会变化,所以STFT还是无法满足非稳态信号变化的频率的需求。
三、小波变换
那么你可能会想到,让窗口大小变起来,多做几次STFT不就可以了吗?!没错,小波变换就有着这样的思路。 但事实上小波并不是这么做的(关于这一点,方沁园 同学的表述“小波变换就是根据算法,加不等长的窗,对每一小部分进行傅里叶变换”就不准确了。小波变换并没有采用窗的思想,更没有做傅里叶变换。) 至于为什么不采用可变窗的STFT呢,我认为是因为这样做冗余会太严重,STFT做不到正交化 ,这也是它的一大缺陷。
于是小波变换的出发点和STFT还是不同的。STFT是给信号加窗,分段做FFT ;而小波直接把傅里叶变换的基给换了——将无限长的三角函数基 换成了有限长的会衰减的小波基 。这样不仅能够获取频率 ,还可以定位到时间 了 ~
【解释】
来我们再回顾一下傅里叶变换吧,没弄清傅里叶变换为什么能得到信号各个频率成分的同学也可以再借我的图理解一下。
傅里叶变换把无限长的三角函数作为基函数:
<img src="https://pic4.zhimg.com/be914c25f4886601caf2324b855b2b9f_b.jpg" data-rawwidth="732" data-rawheight="504" class="origin_image zh-lightbox-thumb" width="732" data-original="https://pic4.zhimg.com/be914c25f4886601caf2324b855b2b9f_r.jpg">
这个基函数会伸缩 、会*移(其实本质并非*移,而是两个正交基的分解)。缩得窄,对应高频;伸得宽,对应低频。然后这个基函数不断和信号做相乘。某一个尺度(宽窄)下乘出来的结果,就可以理解成信号所包含的当前尺度对应频率成分有多少。于是,基函数会在某些尺度下,与信号相乘得到一个很大的值,因为此时二者有一种重合 关系。那么我们就知道信号包含该频率的成分的多少。
仔细体会可以发现,这一步其实是在计算信号和三角函数的相关性。
<img src="https://pic2.zhimg.com/8fbc3a5f07a5ab0f0a90b65bc621ae21_b.jpg" data-rawwidth="452" data-rawheight="311" class="origin_image zh-lightbox-thumb" width="452" data-original="https://pic2.zhimg.com/8fbc3a5f07a5ab0f0a90b65bc621ae21_r.jpg"> <img src="https://pic3.zhimg.com/95cfa4aa2b2ea493cf07dbd4384d2526_b.jpg" data-rawwidth="509" data-rawheight="297" class="origin_image zh-lightbox-thumb" width="509" data-original="https://pic3.zhimg.com/95cfa4aa2b2ea493cf07dbd4384d2526_r.jpg">看,这两种尺度能乘出一个大的值(相关度高),所以信号包含较多的这两个频率成分,在频谱上这两个频率会出现两个峰。
看,这两种尺度能乘出一个大的值(相关度高),所以信号包含较多的这两个频率成分,在频谱上这两个频率会出现两个峰。
以上,就是粗浅意义上 傅里叶变换的原理。
如前边所说,小波做的改变就在于,
将无限长的三角函数基换成了有限长的会衰减的小波基 。
<img src="https://pic3.zhimg.com/94b5f53d29d655e0a4d90fa867027eda_b.jpg" data-rawwidth="675" data-rawheight="477" class="origin_image zh-lightbox-thumb" width="675" data-original="https://pic3.zhimg.com/94b5f53d29d655e0a4d90fa867027eda_r.jpg">这就是为什么它叫“小波”,因为是很小的一个波嘛~
这就是为什么它叫“小波”,因为是很小的一个波嘛~
<img src="https://pic1.zhimg.com/f3342ad8f9f814beecf82b29b0576ef0_b.jpg" data-rawwidth="389" data-rawheight="71" class="content_image" width="389">
从公式可以看出,不同于傅里叶变换,变量只有频率ω,小波变换有两个变量:尺度a(scale)和*移量 τ(translation)。尺度 a控制小波函数的伸缩 ,*移量 τ控制小波函数的*移 。尺度 就对应于频率 (反比),*移量 τ就对应于时间 。
<img src="https://pic2.zhimg.com/c4aa4c1cc6fdc1feb47be1001fa67301_b.jpg" data-rawwidth="592" data-rawheight="341" class="origin_image zh-lightbox-thumb" width="592" data-original="https://pic2.zhimg.com/c4aa4c1cc6fdc1feb47be1001fa67301_r.jpg">
当伸缩、*移到这么一种重合情况时,也会相乘得到一个大的值。这时候和傅里叶变换不同的是,这不仅可以知道信号有这样频率的成分,而且知道它在时域上存在的具体位置。
而当我们在每个尺度下都*移着和信号乘过一遍后,我们就知道信号在每个位置都包含哪些频率成分 。
看到了吗?有了小波,我们从此再也不害怕非稳定信号啦!从此可以做时频分析啦!
做
傅里叶变换只能得到一个频谱 ,
做小波变换却可以得到一个时频谱 !
<img src="https://pic2.zhimg.com/27adabe9c43e9716543ac6e08a983505_b.jpg" data-rawwidth="277" data-rawheight="208" class="content_image" width="277"> ↑:时域信号 ↑:时域信号
<img src="https://pic1.zhimg.com/f0511af35a25dcbfc760959bec38b6cc_b.jpg" data-rawwidth="404" data-rawheight="302" class="content_image" width="404">↑:傅里叶变换结果
↑:傅里叶变换结果
<img src="https://pic1.zhimg.com/cfae89c24cc167c028f02368ee509a68_b.jpg" data-rawwidth="524" data-rawheight="403" class="origin_image zh-lightbox-thumb" width="524" data-original="https://pic1.zhimg.com/cfae89c24cc167c028f02368ee509a68_r.jpg"> ——此图像来源于“THE WAVELET TUTORIAL”
——此图像来源于“THE WAVELET TUTORIAL” ↑:小波变换结果
小波还有一些好处,比如,我们知道
对于突变信号,傅里叶变换存在吉布斯效应 ,我们用无限长的三角函数怎么也拟合不好突变信号 :
<img src="https://pic3.zhimg.com/c6041e8710f31ab327e215467d2c58d2_b.jpg" data-rawwidth="691" data-rawheight="474" class="origin_image zh-lightbox-thumb" width="691" data-original="https://pic3.zhimg.com/c6041e8710f31ab327e215467d2c58d2_r.jpg">然而衰减的小波就不一样了: 然而衰减的小波就不一样了:
<img src="https://pic3.zhimg.com/d03e5344001f6fb2dc10be4a7bd2af92_b.jpg" data-rawwidth="677" data-rawheight="522" class="origin_image zh-lightbox-thumb" width="677" data-original="https://pic3.zhimg.com/d03e5344001f6fb2dc10be4a7bd2af92_r.jpg">
以上,就是小波的意义。
-----------------------------------------------------------------------------------------------------------
以上只是用形象地给大家展示了一下小波的思想,希望能对大家的入门带来一些帮助。毕竟如果对小波一无所知,直接去看那些堆砌公式、照搬论文语言的教材,一定会痛苦不堪。 在这里推荐几篇入门读物,都是以感性介绍为主,易懂但并不深入,对大家初步理解小波会很有帮助。文中有的思路和图也选自于其中: 1. THE WAVELET TUTORIAL (强烈推荐,点击链接:INDEX TO SERIES OF TUTORIALS TO WAVELET TRANSFORM BY ROBI POLIKAR ) 2. WAVELETS:SEEING THE FOREST AND THE TREES 3. A Really Friendly Guide to Wavelets 4. Conceptual wavelets
但是真正理解透小波变换,这些还差得很远。比如你至少还要知道有一个“尺度函数” 的存在,它是构造“小波函数”的关键,并且是它和小波函数一起才构成了小波多分辨率分析,理解了它才有可能利用小波做一些数字信号处理;你还要理解离散小波变换、正交小波变换、二维小波变换、小波包……这些内容国内教材上讲得也很糟糕,大家就一点一点啃吧~
第一次在知乎写这么长的回答,都是利用实验室搬完砖之余的时间一点点弄的,欢迎分享,如转载还请跟我说一声哈~
作者:咚懂咚懂咚
链接:https://www.zhihu.com/question/22864189/answer/40772083
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
2. 关于正交化 什么是正交化?为什么说小波能实现正交化是优势? 简单说,如果采用正交基,变换域系数会没有冗余信息,变换前后的信号能量相等 ,等于是用最少的数据表达最大的信息量,利于数值压缩等领域 。JPEG2000压缩就是用正交小波变换。 比如典型的正交基:二维笛卡尔坐标系的(1,0)、(0,1) ,用它们表达一个信号显然非常高效,计算简单。而如果用三个互成120°的向量表达,则会有信息冗余 ,有重复表达。 但是并不意味着正交一定优于不正交。比如如果是做图像增强,有时候反而希望能有一些冗余信息,更利于对噪声的抑制和对某些特征的增强。
3. 关于瞬时频率 原问题:图中时刻点对应一频率值,一个时刻点只有一个信号值,又怎么能得到他的频率呢? 很好的问题。如文中所说,绝对意义的瞬时频率其实是不存在的。单看一个时刻点的一个信号值,当然得不到它的频率。我们只不过是用很短的一段信号的频率作为该时刻的频率,所以我们得到的只是时间分辨率有限的*似分析结果。这一想法在STFT上体现得很明显。小波用衰减的基函数去测定信号的瞬时频率,思想也类似。(不过到了Hilbert变换,思路就不一样了,以后有机会细讲)
4. 关于小波变换的不足 这要看和谁比了。 A.作为图像处理方法,和多尺度几何分析方法(超小波)比: 对于图像这种二维信号的话,二维小波变换只能沿2个方向进行,对图像中点的信息表达还可以,但是对线就比较差。而图像中最重要的信息恰是那些边缘线,这时候ridgelet(脊波), curvelet(曲波)等多尺度几何分析方法就更有优势了。