小波变换
1 小波产生的背景与历史
1.0 小波历史简介
1.0.1 傅立叶分析的发展历程
(一) 傅里叶变换 FT
1807年,法国学者Fourier指出任何周期函数都可以用一系列正弦波来表示,开创了傅立叶分析。
-
(1) 操作过程
从数学角度而言,对一个函数进行傅立叶变换(Fourier Transform,FT)。从信号处理的角度而言,对任意信号f(t)的频谱F(w)进行分析。 -
(2) 优点
能够准确刻画平稳信号在整个时(空)域的频率性质。 -
(3) 缺点
不能反映非平稳信号在局部区域的频域特征及其对应关系,即FT在时域没有任何分辨率,无法确定信号奇异性的位置。
(二) 短时傅里叶变换 STFT
1946年,Gabor提出了短时傅立叶变换(Short Time Fourier Transform, STFT)。
-
(1) 操作过程
对信号进行加窗,再对加窗后的信号进行傅立叶变换,从而得到信号在局部区域的频谱。 -
(2) 优点
能够分析信号局部频域特征。 -
(3) 缺点
由于STFT中时间窗的宽度与频率无关,它仍然是一种恒分辨率分析。
(三) 维格纳-威尔分布 WVD
1948年,Ville提出了维格纳-威尔分布(Wigner-Ville Distribution, WVD),并引入时频信号分析。
-
(1) 操作过程
信号中心协方差函数的傅立叶变换。 -
(2) 优点
具有对称性、时移不变性、真边缘性、平均瞬时频率等优良性质,WVD的时频分辨率比STFT的分辨率高。 -
(3) 缺点
存在交叉干扰项(Cross-Term Interference, CTI),这是二次型时频分布的固有结果,大量的CTI会淹没或严重干扰信号的自项,模糊信号的原始特征。
1.0.2 小波分析的发展历程
(一) Haar小波分析
1910年,Haar提出了\(L^2(\mathbb R)\)中第一个小波规范正交基,即Haar正交基。
-
(1) 操作过程
Haar正交基是以一个简单的二值函数作为母小波经平移和伸缩而形成的。 -
(2) 优点
Haar小波变换具有最优的时(空)域分辨率。 -
(3) 缺点
Haar小波基是非连续函数,因而Haar小波变换的频域分辨率非常差。 -
1936年,Littlewood和Paley对傅立叶级数建立了二进制频率分量分组理论,(即L-P理论:按二进制频率成分分组,其傅立叶变换的相位并不影响函数的大小和形状),这是多尺度分析思想的最早起源;
-
1952年~1962年,Calderon等人将L-P理论推广到高维,建立了奇异积分算子理论;
-
1965年,Calderon发现了著名的再生公式,给出了抛物型空间上H1的原子分解;
-
1974年,Coifman实现了对一维空间和高维空间的原子分解;
-
1976年,Peetre在用L-P理论对Besov空间进行统一描述的同时,给出了Besov空间的一组基;
-
1981年,Stromberg引入了Sobolev空间HP的正交基,对Haar正交基进行了改造,证明了小波函数的存在性。
-
1981年,法国地球物理学家Morlet提出了小波的正式概念;
-
1985年,法国数学家Meyer提出了连续小波的容许性条件及其重构公式。
-
1986年,Meyer在证明不可能存在同时在时频域都具有一定正则性(即光滑性)的正交小波基时,意外发现具有一定衰减性的光滑性函数以构造L2(R)的规范正交基(即Meyer基),从而证明了正交小波系的存在。
-
1984年~1988年,Meyer、Battle和Lemarie分别给出了具有快速衰减特性的小波基函数:Meyer小波、Battle-Lemarie样条小波。
(二) Mallat算法
1987年,Mallat将计算机视觉领域中的多尺度分析思想引入到小波分析中,提出了多分辨率分析的概念,统一了在此前的所有具体正交小波的构造,给出了构造正交小波基的一般方法,提出了快速小波变换(即Mallat算法)。它标志着第—代小波的开始?
-
(1) 操作过程
先滤波,再进行抽二采样。 -
(2) 优点
Mallat算法在小波分析中的地位相当于FFT在经典傅立叶分析中的地位。它是小波分析从纯理论走向实际应用。 -
(3) 缺点
以傅立叶变换为基础,直接在时(空)域中设计滤波器比较困难,并且计算量大。 -
1988年,Daubechies基于多项式方式构造出具有有限支集的光滑正交小波基(即Daubechies基)。
-
1992年,Daubechies对这些演讲内容进行了总结和扩展形成了小波领域的经典著作——小波十讲《Ten Lectures on Wavelet》。
-
1992年3月,国际权威杂志《IEEE Transactions on Information Theory》专门出版了“小波分析及其应用”专刊,全面介绍了此前的小波分析理论和应用及其在不同学科领域的发展,从此小波分析开始进入了全面应用阶段。
-
1992年,Kovacevic和Vetterli提出了双正交小波的概念。
1992年,Cohen、Daubechies和Feauveau构造出具有对称性、紧支撑、消失矩、正则性等性质的双正交小波。
-
(1) 操作过程
利用两组互为对偶的尺度函数和小波函数实现函数的分解与重构。 -
(2) 优点
具有正交小波无法同时满足的对称性、紧支撑、消失矩、正则性等性质。
(三) 小波包(Wavelet Packet, WP)分析
1992年,Coifman和Wickerhauser提出了小波包 (Wavelet Packet,WP)分析。
-
(1) 操作过程
不仅对低通子带进行分解,而且也对高通分量分解,从而聚焦到感兴趣的任意频段。 -
(2) 优点
突破了小波分析对信号频带进行等Q划分的局限性。 -
(3) 缺点
最优基的搜索问题。
(四) 多带小波
1992年,Zou等提出了多带小波(M-band Wavelet)理论,将人们对小波变换的研究从“二带"推广到“多带”情况。
基于“二带”小波变换的多分辨率分析中,尺度函数对应一个低通滤波器,而小波函数对应一个高通滤波器。“二带”小波变换把信号分解成不同的通道,而这些通道的带宽相对于尺度函数的对数是相同的,因此高频通道具有较宽的带宽,而低频通道具有较窄的带宽。
参考链接1:小波变换的优缺点发展历程与时频分析
1.1 “点”的概念
1.1.1 表达“点”的方式
一维中,“点”可以表示为“一个数\(x\)”;到了二维平面中,“点”可以表示为“一个数对\((x, y)\)”、或者考虑复平面时可以表示为\(x + \mathrm{i}y\);可以继续拓展下去,到了\(\mathbb{R}^n\)空间中,“点”可以表示为“\(n\)个数\((x_1, x_2, \cdots, x_n)\)”。
我们不可能把空间中的“点/向量”全部表示出来,因此在线性代数中便引入了基的概念,简单来说,基所蕴含的哲学思想就是:
(一) 平凡基
所谓平凡基,就是空间中一些特殊的点/向量,具体表示形式如下:
在这组基下,空间中任意一个点可以表示为:
这样便将“点的差异” \(\Longleftrightarrow\) “系数差异”,将几何与代数联系到了一起(数形结合)。
此时,可能会有两个小问题:① 在某些问题中,若是这种基表达不方便/不合适怎么办;② 若是面对的是连续的形式,那么又该如何处理呢?
首先,第一个小问题:在现有的知识范围内,对一类科学问题,可以线性代数的方式来处理。比如数字信号存储中设计的信号压缩,压缩的方法有很多,若是要求线性压缩,也就意味着把数字信号向量经过线性变换,使得线性变换之后的结果更便于存储。考虑一种简单的情况,就是可以通过变换基的形式,使得信号的表达更加简单:
两组基之间的变换矩阵是一个可逆矩阵。
如何理解/解释正交矩阵矩阵呢,\(\boldsymbol{Q}^{\mathrm T}\boldsymbol{Q} = \boldsymbol{Q}\boldsymbol{Q}^{\mathrm T} = \boldsymbol{I}\)这是代数上的形式,另一方面,正交矩阵也可以理解为:把一组标准正交基变成另一组标准正交基的矩阵,反过来一个线性空间的两个标准正交基之间的过渡矩阵就是正交矩阵。
平凡基的连续形式为冲激函数\(\delta(t)\)。
1.1.2 更复杂的“点”
(一) “点” = 一个数列
这个数列有两种形式:
-
数列的左边固定,右边可以无穷延伸;
-
数列的两边均是无穷延伸的。
此时点可以称为“可数无穷稳定点”。这类点中最典型的就是:\(\mathscr{l}^2(\mathbb{Z})\),其中\(\mathbb{Z} = \{0, \pm 1, \pm2, \cdots\}\)表示所有的整数,该整体\(\mathscr{l}^2(\mathbb{Z})\)表示这是一个线性空间,空间中的点可以表示为:
这个点要有一定限制,要求满足如下条件:
类似于要求信号的能量有限。
(二) “点” = 一个函数
有这么一个空间,空间中有很多很多的点,每个点都代表一个函数,这样说其实有点难以理解(或者说难以建立几何直观),这里老师提供了一种一直思路,如下图所示:
上面由离散变为连续是将离散间隔变为无穷小,当然目前我理解这只是一种比较形象的几何示意。
点表示一个函数,又可以分为两类,一种是“周期函数”,另一种是“非周期函数”。
- 周期函数
把所有这类函数记为:\(L^2(0, \mathrm T)\),这是特别经常使用的一类空间。
- 非周期函数
可以将非周期函数视为周期为无穷大的周期函数,此时只需要满足:
把这类函数记为:\(L^2(\mathbb R)\)、\(L^2(-\infty, +\infty)\),这也是特别经常使用的一类空间。
1.2 傅里叶分析
1807年,傅里叶在论文中指出,任何周期函数,都可以表示为:
该式蕴含了两个优秀的思想:
-
① 从表达的形式来说,不同函数(或者说空间中不同点)的差异转换到系数上;
-
② 对函数/信号的分析,可以通过变换不同的基进行分析。
后来,经过进一步拓展,最终提出了大名鼎鼎的傅里叶变换,对于非周期函数\(f(t)\):
1910年,科学家Haar构造了一个特殊的函数:
在这个函数基础上,Haar提出了:
这样相当于在给定函数\(h(t)\)的基础上,对其进行了挤压/拉伸(类似FT)+平移。如果只是限制在\(L^2[0,1]\)的空间中,则把\(h_{j,k}(t)\)上截断就构成了\(L^2[0,1]\)的一组标准正交基;若不加限制,即在\(L^2(\mathrm R)\)中,则\(h_{j,k}(t)\)就是\(L^2(\mathrm R)\)的一组标准正交基。
此时,\(L^2[0,1]\)或者\(L^2(\mathrm R)\)空间中的一个点/函数\(f(t)\)就可以表示为:
这个成果在当时没有引起很大的“浪花”,直到1980年代,地震勘探专家Morlet把短时傅里叶变换(又称加窗傅里叶变换,STFT)进行了修改。
1946年,Gabor提出的STFT的表达形式为:
其表示的含义可概述为:原始信号\(f(t)\)在时间点\(t_0\)附近(由窗函数\(g\)的形式决定),频率为\(\omega\)的频率成分。STFT满足:
逆STFT变换为:
STFT的结果已经很好了,但是人们还是发现了不足之处——窗\(g(\cdot)\)的宽度形式与频率\(\omega\)没有关联,但是我们知道要想把频率\(\omega\)计算地比较准确,在\(\omega\)比较小的时候,时间窗应该要长一些,在\(\omega\)比较大的时候,时间窗要短一些才能跟上快速变化的信号。
因此小波的方法就提出来了(1980年),小波把\(g(t-t_0) \mathrm{e}^{-\mathrm j \omega t}\)当作一个整体来看,提出了如下形式:
2 小波的基础知识
2.1 信号空间
小波中使用的线性空间主要有两个:
- 周期为\(2\pi\),且在一个周期内能量有限的信号全体:\(L^2(0, 2\pi)\);
- 非周期的能量有限的信号全体:\(L^2(\mathbb{R}) = \left\{f(t) \mid \displaystyle\int_{-\infty}^{+\infty}|f(t)|^2 \text{ d}t < +\infty \right\}\)。
2.2 \(L^2(\mathbb{R})\)空间的基本概念与性质
(一) 线性性质
取\(f(t) \in L^2(\mathbb{R})\)、\(g(t) \in L^2(\mathbb{R})\),则有:
(二) 内积的概念
(三) 模长或范数
有了这些性质,可将\(L^2(\mathbb{R})\)称为范数空间或者希尔伯特(Hilbert)空间。
2.3 \(L^2(\mathbb{R})\)空间的傅里叶变换
2.3.1 FT与IFT变换
FT可以看作是\(f(t)\)与\(g(t) = \mathrm e^{\mathrm j \omega t}\)的内积,或者是\(f(t)\)向\(g(t)\)构成的基上投影。FT表达式给出的是信号\(f(t)\)其中包含的频率为\(\omega\)的频率成分的分量大小,所以FT又称作“谱分析”。
谱分析:在指定的频率上有多少能量,一个信号的能量沿着不同的频率的分布情况(Ps:也可以参考张颢老师的关于谱分析的解释)。
2.3.2 FT的性质
(一) Parseval Relation(保内积、能量守恒)
(二) 时域与频域的对偶
其中,\(\otimes\)表示卷积。
这种对偶关系一线性代数的观念来看,就是卷积算子在傅里叶基之下被对角化了。
2.3.3 FT存在的不足
(1) 傅里叶变换对局部的分析或者说局部产生突变时无法分析。
这一点可以从FT的基函数来形象解释,当\(\omega\)固定时,基\(\mathrm e^{-\mathrm j \omega t}\)是一个幅度不变、周期不变、时间从\(-\infty\)到\(\infty\)一直无穷延续的函数,这就意味着如果信号\(f(t)\)存在一个频率为\(\omega\)的频率成分,则从\(-\infty\)到\(\infty\)一直存在,并且在任何局部的地方不会发生变化。
此外,FT还存在一个很奇怪的点,即信号\(f(t)\)是属于\(L^2(\mathbb R)\)空间的,基函数\(\mathrm e^{-\mathrm j \omega t}\)却不在\(L^2(\mathbb R)\)空间中,但是它们还可以作用并得到有意义的结果。
(2) FT结果产生微小扰动时,IFT的结果会产生很大的偏差。
总之,傅里叶变化将信号分的太细了,以至于不同信号之间的区分界限变得很模糊,反而不利于分析。
Ps:关于这一点,老师给了一个“猪肉馅”和“人肉馅”的例子,帮助形象理解,具体参考第06讲 20:00分钟。
因此,若想要改进FT这个工具,一种改进方向就是换基,选择一组更好的基。下面就要介绍一下小波基。
2.4 小波
2.4.1 小波的基本定义
满足如下两个条件就可以称为小波:
-
① \(\psi(t)\)是能量有限的,即\(\psi(t) \in L^2(\mathbb R)\);
-
② 要求其容许参数满足:\(C_{\psi} = \displaystyle\int_{-\infty}^{+\infty} \dfrac{|\hat{\psi}(\omega)|^2}{|\omega|} \text{ d}\omega < +\infty\)
则称\(\psi(t)\)是一个小波(母函数)。
有了小波母函数,则对\(\forall a \neq 0, b \in \mathrm{R}\),连续小波定义为:
其中,称\(a\)为尺度参数,控制母函数的缩放,\(b\)为位移参数,控制母函数在时间轴上的平移量。
2.4.2 小波几点注解
(一) \(\psi_{a, b}(t)\)的波形——衰减特征
(二) \(\psi_{a, b}(t)\)的波形——波动特征
为了证明上述结论,这里做一点额外的假设(当然也会导致证明不是那么严谨):设\(\psi(t)\)的傅里叶变换\(\hat{\psi}(\omega) = \dfrac{1}{\sqrt{2 \pi}}\int_{-\infty}^{+\infty} \psi(t) \mathrm e^{-\mathrm j \omega t} \text{ d}t\)在\(\omega =0\)处是连续的。
再结合容许参数的要求,就可以证明上述结论了。
(三) \(\psi_{a, b}(t)\)的波形——\(a\)、\(b\)的影响
首先,看一下特殊情况,此时\(a = 1, b = 0\),也就是:\(\psi_{1,0}(t) = \psi(t)\)。小波母函数取为Haar小波:
- 尺度\(a\)的第一种情况:\(a > 1, b = 0\) 矮胖
- 尺度\(a\)的第二种情况:\(0< a < 1, b = 0\) 瘦高
在FT变换中,频率\(\omega\)的物理意义很明显易懂,就是振动的快慢;但是到了小波当中,已经没有了明显的频率变量,通过上述两个图,其实可以看出,表示变化快慢的变量指标其实可以通过参数\(a\)来考察。
- 位移\(b\)的情况:\(a = 1, b\)
就是进行左右平移了。
2.4.3 小波变换
(一) 小波变换基本定义
对于任意一个信号\(f(t) \in L^2(\mathbb R)\),其小波变换为:
上面就是对信号进行小波变换的形式。
由表达式可以看到,小波变换把一维的信号\(f(t)\)变换到了二维进行分析,这称为“升维分析”,属于一种逆向思维。
其他的“升维分析”的例子:支持向量机SVM、神经网络。
(二) 小波变换的基本性质
- 小波变换的Parseval Relation(能量守恒)
展开其具体形式为:
其中,\(\mathrm R^* = \mathrm R - \{0\}\),即扣去0点。
- 范数守恒
一般\(C_{\psi} = 常量\),这个常量可能取1也可能不取1,因此小波变换不一定是正交变换。
- 逆小波变换
根据逆小波变换的表达式可以看到,当\(0<a<1\)时,\(\dfrac{1}{a^2}\)使得\(W_f(a,b)\)在重建\(f(t)\)中权重变大,而当\(a>1\)时,\(\dfrac{1}{a^2}\)使得\(W_f(a,b)\)在重建\(f(t)\)中权重变小。
注释1:令\(g(t) = \dfrac{1}{C_{\psi}} \displaystyle\iint_{\mathrm R \times \mathrm R^*} W_f(a,b) \psi_{a,b}(t) \dfrac{1}{a^2} \text{ d}a \text{d}b\),则逆小波变换就是“\(f(t) = g(t)\)”,这里之所以打上了引号,是因为运行存在不相等的点,但是这些点不是很多,把这些不相等的点组成一个点集,要求这个点集的长度等于0,其实这里表达是几乎处处相等,具体可以参考测度论/泛函分析/实分析的内容。(Ps:第9讲 09:00分钟)
但是,当\(t = t_0\),\(f(t)\)是连续的时候,\(f(t_0) = g(t_0)\)。
注释2:在\(L^2(\mathrm R)\)空间中,信号能量都是有限的,即\(\displaystyle\int_{-\infty}^{+\infty} |f(t)|^2 \text{ d}t < +\infty\),而若\(f(t)\)能被拿过来进行积分考察能量是否有限,需要保证\(f(t)\)是处处连续的,否则这个积分都没法积。因此注释1和2联立在一起,则能保证小波变换数值相等。
注释3:测度——\(\dfrac{\text{d}a \text{d}b}{a^2}\),可以看到由于分母存在\(a^2\)项,导致\(a\)很小(对应于高频)时,\(W_f(a,b)\)获得的权重越大,\(a\)很大(对应于低频)时,\(W_f(a,b)\)获得的权重越小,越不重要。因此对信号的小波分析,主要集中在\(a\)较小的部分进行分析。
3 小波变换的基本理论
3.1 吸收/对称小波
所谓“吸收分析”就是将\(a<0\)的那部分信息吸收/折叠到\(a>0\)的部分,类似于降低计算量。因此需要通过对小波母函数进行更加详细的设置。
如果上式是成立的,则对应的小波\(\psi(t)\)称为吸收小波。此时,前面提到的3条性质都会变得更加简洁:
- Parseval Relation(能量守恒)
- 范数守恒
- 逆小波变换
3.2 二进小波
对小波函数本身施加更加严格的条件/限制,使得它对信号\(f(t)\)的信息能够更好的凝聚。二进小波是将连续小波变换中的尺度参数\(a\)离散化为2的整数次幂的方式:
其中,\(A\)和\(B\)是非\(0\)非\(\infty\)的正常数。若\(\psi(t)\)满足上面的约束条件(又称稳定性条件),则称为是二进小波(Ps:这里只要求对\(\omega\)处处成立即可)。
- 逆二进小波变换
其中,\(\tau(t)\)满足:
上式同样只需要满足几乎处处即可,称\(\tau(t)\)为\(\psi(t)\)的重构/对偶小波。
小节:\(\psi(t)\)用于分解,进行小波正变换,\(\tau(t)\)用于重构,做小波逆变换。
如何找到对应\(\psi(t)\)的重构/对偶小波\(\tau(t)\)呢?(Ps:第10节 23:00分钟)。
此时\(\hat{\tau}(\omega)\)显然满足上式。容易证明(Ps:第11节 00:30秒),这个\(\hat{\tau}(\omega)\)是能量有限的。
3.3 正交小波
尺度参数\(a\)在二进小波的条件下能够离散化,那么位移参数\(b\)呢?可以证明,再进一步增加约束条件,就可以得到\(b\)的离散形式,此时对应正交小波。
若\(\psi(t)\)满足:
构成\(L^2(\mathbb{R})\)的标准正交基(O.N.B
),则称\(\psi(t)\)是正交小波。
这个条件已经算是相当苛刻了,在该约束条件下相当于:\(a = 2^{-j}, b = 2^{-j}k\)。
此时,在正交小波的形式下,其逆变换为:
其中,\(\alpha_{j,k}\)的计算为:
也就是:
4 多分辨分析(正交小波分析)和小波构造
4.1 正交小波分析
4.1.1 常见的正交小波
(一) Haar小波
由Haar小波离散化得到的:
构成\(L^2(\mathbb{R})\)上的标准正交系:
之后,若能进一步验证\(L^2(\mathbb{R})\)上的任意一个信号都可以写成上面这组标准正交系的线性组合,那么此标准正交系就升级成为了标准正交基。
(二) 香农小波
下面将借助香农采样定理作为一个桥梁,试图找到\(L^2(\mathbb{R})\)空间中的一个特殊信号\(\psi(t)\),构成一个正交小波。
- 香农采样定理
对于\(\forall f(t) \in L^2(\mathrm R)\),若\(f(t)\)是一个带宽有限信号,即:
则有(\(\mathrm{sinc}\)插值公式):
其中,采样间隔需要满足:\(0 < \Delta_{\mathrm T} \leq \dfrac{\mathrm{\pi}}{B}\)。
考察特殊情况1: $B = \mathrm{\pi}$,采样间隔需要满足:$0 < \Delta_{\mathrm T} \leq 1$(这里取为1)
$$
f(t) = \sum_{n = -\infty}^{+\infty} f(n) \mathrm{sinc} (\mathrm{\pi}(t - n)) = \sum_{n = -\infty}^{+\infty} f(n) \phi(t - n)
$$
其中,\(\phi(t) = \mathrm{sinc}(\mathrm{\pi} t)\) 下面验证是否有如下表达式成立,若成立,则\(\phi(t)\)可以看成是一种基: \[\langle \phi(t - n), \phi(t - m) \rangle = \delta(n-m)
\] 将内积展开: \[\begin{aligned}
\langle \phi(t - n), \phi(t - m) \rangle &= \int_{-\infty}^{+\infty}\phi(t - n) \overline{\phi(t - m)} \text{ d}t \\
&= \frac{1}{2\pi}\int_{-\infty}^{+\infty}\hat{\phi}(\omega)\mathrm{e}^{-\mathrm j n \omega} \overline{\hat{\phi}(\omega)\mathrm{e}^{-\mathrm j m \omega}} \text{ d}\omega \\
&= \frac{1}{2\pi}\int_{-\infty}^{+\infty}|\hat{\phi}(\omega)|^2\mathrm{e}^{-\mathrm j (n-m) \omega} \text{ d}\omega \\
&= \frac{1}{2\pi}\int_{-\pi}^{+\pi} \mathrm{e}^{-\mathrm j (n-m) \omega} \text{ d}\omega \\
&= \delta(n-m)
\end{aligned}
\] 也即得到了验证;此时,满足此条件的信号空间为: \[\mathbb V_0 = \left\{f(t) \mid\hat{f}(\omega) = 0, |\omega|> \pi \right\}
\] 总上,\(\{\phi(t-n) \mid n \in \mathbb Z \}\)构成\(\mathbb V_0\)的标准正交基 |
由这2个特殊情况做进一步拓展:若让\(j \to \infty\),则\(\mathbb V_j\)是不是就能趋近\(L^2(\mathbb R)\)且\(\mathbb V_j\)的基\(\{\phi_{j,n}(t) \mid n \in \mathbb{Z}\}\)能不能逼近整个\(L^2(\mathbb R)\)空间的基。
这里解释一下\(\mathbb V_j \to L^2(\mathbb R)\):所谓集合的序列趋近一个更大的集合,则\(L^2(\mathbb R)\)空间中的每一个点都可以在\(\mathbb V_j\)中找到对应的点,用数学符号表达就是:
\(f_j(t) \to f(t)\)在此空间中表示:\(\displaystyle\int_{-\infty}^{+\infty} |f_j(t) - f(t)|^2 \text{ d}t \to 0\)
根据傅里叶变换是一个酉变换可得:
形象化的理解证明请参考课程第14讲 22:00分钟。
正交基的逼近:
不加证明,取个特例\(n=0\)来看一下上式取极限之后的结果:
可以看到最终取极限的结果是冲激函数\(\delta(t)\),但是这样就没有什么意义了,冲激函数本身不需要任何条件分析就可以认为是\(L^2(\mathbb R)\)空间的一组基(而且还是类似于线性代数中的平凡基),我们利用小波理论希望是满足特殊形式的基:
通过如此复杂的分析,却没得到有意义的结果。
那么这里出现什么问题了呢?(具体的、深刻的、内在的、本质的原因我暂时还说不出来,也听不太懂)老师最后说:\(\mathbb V_j\)的小波基逼近\(L^2(\mathbb R)\)的基的方式和\(\mathbb V_j\)逼近\(L^2(\mathbb R)\)的方式不同导致的。多分辨分析产生的重要一环是分析这两种逼近的一致性。
做研究迷茫了、发现结果跟预想的不一样了,可以试着回到出发点看看一开始是不是就发生了错误,或者可以试试逆着往回推导,看看能不能发现不正确的地方。
设任给一个\(j \in \mathbb Z\):
\(j\)固定,当\(k\)取遍所有整数的时候得到一组向量,这组向量构成一组标准正交系O.N.S
,由这个O.N.S
作为一个O.N.B
生成一个线性子空间,这里将其记为\(\mathbb W_j\),将其形式重写为:
上式的意思是,把\(\phi_{j,k}\)当作基函数做线性组合构成的集合,如果该集合对线性运算封闭,则构成线性子空间;\(\mathrm{Close}\)的含义为要求用这种方式生成的向量构成一个序列,若这个序列收敛,则把收敛极限一并放入该集合内,也就是说\(\mathbb W_j\)总是一个闭集。
小结:\(\mathbb W_j\)就是以\(\psi_{j,k}(t)\)这组
O.N.S
为O.N.B
构成的线性子空间。
下面考察\(\mathbb W_j\)的一些性质。
- ① 当\(j \neq j'\)时,\(\mathbb W_j\)与\(\mathbb W_{j'}\)是正交的;
根据这条性质,可以判断\(\mathbb W_j\)与\(\mathbb W_{j+1}\)肯定是正交的,此时回过头去看一下前面根据取极限得到\(\delta(t)\)的过程出现的问题。由\(\mathbb V_j\)的定义,显然得到\(\mathbb V_j\)与\(\mathbb V_{j+1}\)不是正交的,从频谱上看,\(\mathbb V_{j+1}\)是包含\(\mathbb V_{j}\)的(即\(\mathbb V_{j}\)是\(\mathbb V_{j+1}\)的子空间)。
- ② 由于\(\mathbb W_j\)是相互正交的,因此若所有的\(\mathbb W_j\)逼近整个空间\(L^2(\mathbb R)\),则一定是通过直和的方式,即\(L^2(\mathbb R) = \displaystyle\oplus_{j = -\infty}^{\infty} \mathbb W_j\)。
- ③ \(\mathbb W_j\)之间的关系:若得到\(\mathbb W_0\),则其他的所有\(\mathbb W_j\)可以由\(\mathbb W_0\)在时间上压缩或者拉伸2的倍数,再乘以一个归一化因子即可。
考察几个特例:
- ④ 根据第③条结论,可以得到\(g(t) \in \mathbb W_j\)的充分必要条件为\(g(2t) \in \mathbb W_{j+1}\)
综上,两种方式逼近\(L^2(\mathbb{R})\)可形象地用下图表示。
那么\(\mathbb{V}_j\)如何组织成\(\mathbb{W}_j\)的形式呢?
通过取几个特例容易验证,\(\mathbb{V}_0\)中的基均不在\(\mathbb{V}_1\)中(Ps:第16节 8:00分钟,此外根据上面的图可知\(\mathbb{V}_0\)空间包含在\(\mathbb{V}_1\)空间中,即\(\mathbb{V}_0\)是\(\mathbb{V}_1\)的子空间,因此虽然基都不相同,但是\(\mathbb{V}_0\)中的向量还是可以由\(\mathbb{V}_1\)中的向量线性表示)。
这样看来,\(\mathbb V_0 \to \mathbb V_1 \to \cdots \to \mathbb V_{+\infty}\)在这个过程中,之前找的基全部抛弃再重新找基,我们想像\(\mathbb{W}_j\)一样,不是重新找,而是在之前的基础上往上添加,也就是:
之后我们将会发现,\(\mathbb{W}_j\)就是前面提到的\(\mathbb{W}_j\)。下面绘制一下特殊的\(\mathbb V_0 \to \mathbb V_1\)的示意图,看一下\(\mathbb{W}_0\)的构成。
根据\(\mathbb V_0\)和\(\mathbb V_1\)的定义以及上面的示意图,容易得到:
这里将\(\mathbb V_0\)和\(\mathbb V_1\)的形式重写如下:
因此,从频域上看,可得到如下结论:
4.1.2 小结
由\(\mathbb W_0\)的O.N.B
\(\{\psi(t-n) \mid n \in \mathbb Z\}\)以及\(g(t) \in \mathbb W_j \Longleftrightarrow g(2t) \in \mathbb W_{j+1}\)可知,\(\mathbb W_j\)的O.N.B
为:
根据一开始的定义:
- 当\(j \to +\infty\)时,\(\mathbb V_i \to L^2(\mathbb R)\):\(\overline{\left(\displaystyle\cup_{j \in \mathbb Z} \mathbb V_j\right)} = L^2(\mathbb R)\)
闭包:\(X\)是拓扑空间,\(A \subset X\),则包含\(A\)的所有闭集的交称为 \(A\)的闭包,记为\(\overline A\)。
由定义得\(\overline A\)是包含\(A\)的最小闭集,因为由闭集的任意交是闭集得\(\overline A\)是闭集
- 当\(j \to -\infty\)时:\(\displaystyle\cap_{j \in \mathbb Z} \mathbb V_j= \{0\}\)
\(\forall f(t) \in \cap_{j \in \mathbb Z} \mathbb V_j\),当\(\omega \neq 0\)时,\(\hat f(\omega) = 0\),\(\omega = 0\)时,同样有\(\hat f(\omega) = 0\)。
因为若\(\hat f(0) \neq 0 \Leftrightarrow \displaystyle\int_{-\infty}^{+\infty} f(t) \text{ d}t \neq 0 \Leftrightarrow \displaystyle\int_{-\infty}^{+\infty} |f(t)|^2 \text{ d}t = +\infty\)
综上:
可得:
是\(L^2(\mathbb R)\)上的一个正交小波,称为Shannon小波。
4.2 正交多分辨分析
设\(\{\mathbb V_j, j \in \mathbb Z\}\)是\(L^2\)上的一个闭线性子空间的列,\(\phi(t) \in \mathbb V_0\),满足:
-
单调性/嵌套性:\(\mathbb V_j \subset \mathbb V_{j+1}, \forall j \in \mathbb Z\)
-
稠密性:\(\cup_{j \in \mathbb Z} \mathbb V_j \to L^2(\mathbb R)\),严格写法为:\(\overline{\left(\cup_{j \in \mathbb Z} \mathbb V_j \right)} = L^2(\mathbb R)\)
-
唯一性:\(\cap_{j \in \mathbb Z} \mathbb V_j = \{0\}\)(平凡子空间)
-
伸缩性:\(f(t) \in \mathbb V_j \Longleftrightarrow f(2t) \in \mathbb V_{j+1}\)
-
构造性:\(\{\phi(t - n), n \in \mathbb Z\}\)是\(\mathbb V_0\)的
O.N.B
则称\(\left(\{\mathbb V_j, j \in \mathbb Z\}, \phi(t)\right)\)为\(L^2(\mathbb R)\)上的一个多分辨分析(Multi-resolution Analysis, MRA)。
由以上MRA定义,可得如下几条结论:
-
\(\mathbb V_j\)有
O.N.B
:\(\{\phi_{j,n}(t) = 2^{j/2} \phi(2^j t - n), n \in \mathbb Z\}\) -
\(\mathbb V_j \to L^2(\mathbb R), j \to +\infty\);\(\mathbb V_j \to \{0\}, j \to -\infty\)
-
\(\mathbb W_j \perp \mathbb V_j, \mathbb W_j \oplus \mathbb V_j = \mathbb V_{j+1}, j\in \mathbb Z\)
-
\(\mathbb W_{j1} \perp \mathbb W_{j2}, j1 \neq j2\)
-
\(g(t) \in \mathbb W_j \Longleftrightarrow g(2t) \in \mathbb W_{j+1}\)
这一条的证明参考第19讲 06:00分钟。
-
\(L^2(\mathbb R) = \oplus_{j=-\infty}^{+\infty} \mathbb W_j\)
-
若\(\exists \psi(t) \in \mathbb W_0\)使\(\{\psi(t-n), n \in \mathbb Z\}\)构成\(\mathbb W_0\)的
O.N.B
,则\(\psi(t)\)是正交小波。
\(\{\phi(t-n), n \in \mathbb Z \}\)是\(\mathbb V_0\)的O.N.B
,由\(\phi(t) \in \mathbb V_0, \mathbb V_0 \oplus \mathbb W_0 = \mathbb V_1\),可得存在序列\(\{\xi_n, n \in \mathbb Z\} \in l^2(\mathbb Z)\)使得
上式称为:尺度方程,其中\(\|\phi(t)\|^2 = \displaystyle\sum\limits_{n}|\xi_n|^2 = 1\)。
尺度方程的频域形式为:
其中,记\(\Xi(\omega) = \dfrac{1}{\sqrt 2} \displaystyle\sum_{n} \xi_n \mathrm{e}^{-\mathrm j n \omega}\)为低通滤波器。此低通滤波器中\(\mathrm{e}^{-\mathrm j n \omega}\)周期为\(2\pi\),所以\(\Xi(\omega)\)是周期为\(2\pi\)的,并且结合\(\|\phi(t)\|^2 = \displaystyle\sum\limits_{n}|\xi_n|^2 = 1\)可知\(\Xi(\omega)\)在一个周期内是能量有限的,所以\(\Xi(\omega) \in L^2(0, 2\pi)\)。这里又可以称\(\xi_n\)是低通滤波器的脉冲响应系数。
- \(\{\psi(t-n); n \in \mathbb Z\}\)是\(\mathbb W_0\)的标准正交基,所以\(\phi(t) \in \mathbb W_0\),由于\(\mathbb W_0 \oplus \mathbb V_0 = \mathbb V_1\),故存在\(\{\zeta_n; n \in \mathbb Z \} \in l^2(\mathbb Z)\)满足:
上式称为:小波方程。其中\(\|\psi(t)\|^2 = \displaystyle\sum\limits_{n}|\zeta_n|^2 = 1\)。
小波方程的频域形式为:
定义带通滤波器:
此时,小波方程的频域形式为:
(视频20讲 05:00分钟)
重要引理:
设\(S(t) \in L^2(\mathbb R)\),则\(\{S(t-n); n \in \mathbb Z\}\)是 \[\sum_{k \in \mathbb Z} |\hat S(\omega + 2k\pi)|^2 = 1
\] 大白话就是:信号\(S(t)\)的谱如果满足下面这个等式,那么\(S(t)\)在时间域上的整数平移就构成 |
上述引理的简要证明:
若\(S(t)\)在时间域上的整数平移构成O.N.S
,即意味着:\(\langle S(t-n), S(t-m) \rangle = \delta(n-m)\)。
按照内积的定义:\[\begin{aligned} \langle S(t-n)>, S(t-m) \rangle & = \int_{-\infty}^{+\infty} S(t-n) \overline{S(t-m)} \text{ d}t \\ & = \dfrac{1}{2\pi}\int_{-\infty}^{+\infty} \hat{S}(\omega) \mathrm e^{-\mathrm j \omega n} \overline{\hat S(\omega)}\mathrm e^{-\mathrm j \omega m} \text{ d}\omega \\ & = \dfrac{1}{2\pi} \int_{-\infty}^{+\infty} |\hat{S}(\omega)|^2 \mathrm e^{-\mathrm j \omega (n-m)} \text{ d}\omega \\ & = \dfrac{1}{2\pi} \sum_{k \in \mathbb Z}\int_{2k\pi}^{2(k+1)\pi} \cdots \text{ d}\omega \\ & = \dfrac{1}{2\pi} \sum_{k \in \mathbb Z}\int_{0}^{2\pi} |\hat S(\omega_1 + 2k\pi)|^2 \mathrm e^{-\mathrm j \omega_1 (n-m)} \text{ d}\omega_1 \\ & = \dfrac{1}{2\pi} \int_{0}^{2\pi} \left(\sum_{k \in \mathbb Z}|\hat S(\omega_1 + 2k\pi)|^2\right) \mathrm e^{-\mathrm j \omega_1 (n-m)} \text{ d}\omega_1 \\ & = \delta(n-m) \end{aligned}\]其中进行了变量代换:\(\omega_1 = \omega + 2k\pi\)。详细解释(视频20讲 15:00分钟)。
根据此引理,可知由于\(\{\phi(t-n); n \in \mathbb Z\}\)是\(L^2(\mathbb R)\)上的O.N.S
,故:
上式说明,如果尺度函数\(\phi(t)\)的整数平移构成O.N.S
,那么它对应的低通滤波器满足上式形式,这是一个很有名的滤波器——共轭滤波器。
- 进一步推广,有:
把上述三个条件合写成矩阵的形式,首先引入一个记号\(\boldsymbol \Upsilon(\omega)\):
此时有:
\(\phi(t)\)的整数平移构成\(\mathbb V_0\)的O.N.S
,\(\psi(t)\)的整数平移构成\(\mathbb W_0\)的O.N.S
,\(\phi(t)\)的整数平移和\(\psi(t)\)的整数平移构成相互正交的族的充要条件为\(\boldsymbol \Upsilon(\omega)\)是一个酉矩阵。
若\(\boldsymbol \Upsilon(\omega)\)是酉矩阵,则由:
构造的\(\psi(t) \in \mathbb W_0\)是正交小波。其中\(\{g_n, n \in \mathbb Z\} \in l^2(\mathbb Z)\)是带通滤波器:
的脉冲响应系数。
(21讲 10:00分钟)验证\(\{\psi(t-n), n\in \mathbb Z\}\)是\(\mathbb W_0\)的O.N.B
:
显然,\(\psi(t) \in \mathbb W_0\),而且\(\{\psi(t-n), n\in \mathbb Z\}\)是\(\mathbb W_0\)的O.N.S
,\(\phi(t)\)的整数平移和\(\psi(t)\)的整数平移放在一起可以构成\(\mathbb V_1\)的O.N.S
。下面要证明\(\{\phi(t-n), \psi(t-n), n \in \mathbb Z\}\)将构成\(\mathbb V_1\)的O.N.B
。
记\(\mathbb V'_1 = \mathrm{Closespan}\{\phi(t-n), \psi(t-n), n \in \mathbb Z\}\),显然\(\mathbb V'_1 \subset \mathbb V_1\),从而\(\mathbb V_1 = \mathbb V'_1 \oplus \mathbb W'_1\),其中\(\mathbb V'_1 \perp \mathbb W'_1\)。为了证明\(\mathbb V'_1\)充满整个空间\(\mathbb V_1\),可以通过说明\(\mathbb W'_1\)是一个只包含0元素的平凡子空间,用数学语言描述为:
- 对于\(\forall f(t) \in \mathbb V_1\),若\(f(t) \perp \mathbb V'_1\),则\(f(t) = 0\),即\(\mathbb W'_1 = \{0\}\),从而\(\mathbb V'_1 = \mathbb V_1\)。
因为\(f(t) \in \mathbb V_1\),因此存在序列\(\{f_n, n \in \mathbb Z\} \in l^2(\mathbb Z)\),使得:
两边进行傅里叶变换,有:
其中,\(F\left(\omega\right) = \dfrac{1}{\sqrt 2}\sum\limits_n f_n \mathrm e^{-\mathrm j \omega n}\)。
证明\(f(t) = 0 \quad \Longrightarrow \quad \hat{f}(\omega) = 0 \quad \Longrightarrow \quad F\left(\omega\right) = 0\)。
由于\(f(t) \perp \mathbb V'_1\),因此\(f(t) \perp \phi(t-n), n \in \mathbb Z \Longleftrightarrow \langle f(t), \phi(t-n) \rangle = 0\),由此可得:
再由\(f(t) \perp \psi(t-n), \forall n \in \mathbb Z\)可得:
将上述两式写为矩阵形式:
所以可得:
到此,便证明了\(\{\psi(t-n), n \in \mathbb Z\}\)构成\(\mathbb W_0\)的O.N.B
。
回顾总结:
1️⃣ \(\{\phi(t-n); n \in \mathbb Z\}\)是\(\mathbb V_0\)的标准正交基\(\quad \Longleftrightarrow \quad |\Xi(\omega)|^2 + |\Xi(\omega + \pi)|^2 = 1 \quad \Longleftrightarrow \quad \left[\begin{array}{c} \Xi(\omega) \\ \Xi(\omega+\pi) \end{array}\right] \in L^2(0, 2\pi) \times L^2(0, 2\pi)\)是单位向量。 2️⃣ \(\{\psi(t-n); n \in \mathbb Z\}\)是\(\mathbb W_0\)的标准正交基\(\quad \Longleftrightarrow \quad |\Gamma(\omega)|^2 + |\Gamma(\omega + \pi)|^2 = 1 \quad \Longleftrightarrow \quad \left[\begin{array}{c} \Gamma(\omega) \\ \Gamma(\omega+\pi) \end{array}\right] \in L^2(0, 2\pi) \times L^2(0, 2\pi)\)是单位向量。 3️⃣ \(\{\psi(t-n), n \in \mathbb Z\} \perp \{\phi(t-n), n \in \mathbb Z\}\)等价于 \[\begin{gathered}
\Xi\left(\omega \right) \overline{\Gamma\left(\omega\right)} + \Xi\left(\omega + \pi \right) \overline{\Gamma\left(\omega + \pi\right)} = 0 \\
\Updownarrow \\
\left[\begin{array}{c} \Xi(\omega) \\ \Xi(\omega+\pi) \end{array}\right] \perp \left[\begin{array}{c} \Gamma(\omega) \\ \Gamma(\omega+\pi) \end{array}\right] \\
\Updownarrow \\
\mathbb V_0 \perp \mathbb W_0
\end{gathered}
\] |
4.3 正交小波构造(特例)
取带通滤波器\(\Gamma(\omega)\)为如下形式:
显然有:
另外:
此时:
故\(\boldsymbol \Upsilon(\omega) \boldsymbol \Upsilon^{\mathrm H}(\omega) = \boldsymbol I\)。
\(\psi(t)\)是正交小波。
(23讲)
(一) Haar小波的MRA
综上,\(\{\mathbb V_j, j \in \mathbb Z\}\)和\(\phi(t)\)是一个MRA,称为Haar' MRA。
根据尺度方程可得:
可得:
其对应的频域为:
则有:
由此,可构造正交小波:
此外,另一种算法为:直接计算出系数\(g_n\):
由\(\Gamma(\omega) = \mathrm e^{-\mathrm j\omega} \overline{H(\omega + \pi)}\)确定\(g_n\)与\(h_n\)(\(\xi_n\))的关系:
所以,通过对比等式两端,可得(前提是上述等式两边都是周期为\(2\pi\)的能量有限的信号):
(24讲 18:00)
带入计算可得:
所以有:
5 小波算法
5.1 多分辨分析回顾
按上述讲解的逻辑体系,多分辨分析可分为两个部分:一是闭的线性子空间序列\(\mathbb V_j\),二是选定的尺度函数\(\phi(t)\):
分析的信号所在的空间为\(L^2(\mathbb R)\)。
尺度方程和小波方程体现的是不同线性子空间之间的正交分割关系:
尺度方程:
其系数可通过内积投影计算:
其系数是\(\{\xi_n, n\in \mathbb Z\} \in l^2(\mathbb Z)\),\(\Xi(\omega)\)是共轭滤波器。
所以有:
即\(\{\xi_n, n\in \mathbb Z\}\)是\(l^2(\mathbb Z)\)中的单位向量,而\(\{\xi_n, n\in \mathbb Z\} \perp \{\xi_{n-2l}, n\in \mathbb Z\}(l \neq 0)\)
5.2 小波方程
其中,系数:\(g_n = \langle \psi(t), \sqrt{2} \phi(2t-n) \rangle\),带通滤波器:\(\Gamma(\omega) = \dfrac{1}{\sqrt 2} \sum\limits_n g_n \mathrm e^{-\mathrm j n \omega}\)。并且\(H(\omega)\)与\(\Gamma(\omega)\)是正交共轭滤波器组。
当\(\psi(t)\)是正交小波时候,\(\Gamma(\omega)\)满足如下:
同理可得:\(\{g_n, n\in \mathbb Z\}\)是\(l^2(\mathbb Z)\)中的单位向量,而\(\{g_n, n\in \mathbb Z\} \perp \{g_{n-2l}, n\in \mathbb Z\}(l \neq 0)\),也即:\(\sum\limits_n g_n \overline{g_{n-2l}} = \delta(l)\)。
综上,可得:\(\{h_{n-2l}, g_{n-2l}; n \in mathbb Z, l \in \mathbb Z\}\),构成\(l^2(\mathbb Z)\)的新O.N.B
。
5.3 子空间关系
(25讲结束)
参考链接: