未完成

8 相关分析

8.1 相关的基本概念,相关与褶积的关系

  1. Q: “相关”和“褶积”的数学表达式很类似,那什么方面比较不同呢?
    A: 物理意义往往不同。褶积是滤波或者“平移对称性”,相关是直观上(波形)“相似性”
    相关的两个信号没有“属性”差别。相比之下卷积经常在物理意义上区分“卷积”和“被卷积”
  2. Q: 相似和线性回归有何异同?
    A: 这里的“波形相似”指(竖直方向)放大或缩小一定倍数后形状类似。\(\alpha\)表达式和线性回归公式中斜率表达式相同。
    (当然,书中的\(x,y\)相当于\(x = \alpha y\)的回归。首先\(y,x\)的含义不要弄反了,另外课本正文处相比线性回归没有截距。课后题第2题那里有截距)
  3. Q: 接上,如果我们用\(\alpha y_n +\beta\)作为\(x_n\)的近似信号,那么相关系数公式变为(),其物理直观解释是()。
    这么做之后仍有什么局限?
    A: 习题处有
    如果有一个太强的“直流分量”那么相似性不明显了
    只有函数值变换,不能处理坐标变换(只有竖直方向变换,没有水平方向)
  4. Q: 代入\(\alpha\)的表达式后,误差能量,相对误差能量和相关系数有何关系?
    A: \(\frac 1{N_2-N_1+1}\sum(x-\alpha y)^2=\frac 1\cdots( \sum x^2-\sum (xy)^2/\sum y^2)\)
    \(=\frac {\sum x^2}\cdots (1-\sum(xy)^2/\sum x^2\sum y^2)=\cdots (1-\rho_{xy}(N_1,N_2)^2)\)
    特别注意相关系数\(\rho_{xy}\)\(N_1,N_2\)分别趋于正负无穷时,\(\rho_{xy}(N_1,N_2)\)的极限。
  5. Q: \(r_{xy}=\sum _{n=-\infty}^{+\infty}x_ny_n\)和相关系数有何联系和区别?
    A: 能量有限时可以直接把“无穷”写到求和号上下。
    \(x,y\)能量确定时,\(r_{xy}\)就是“未标准化的”相关系数(没有考虑\(x,y\)本身能量大小)
  6. Q: 互相关函数不是偶函数,因为()。我们人为定义\(r_{xy}(\tau)\)表示\(y_n\)在延迟\(\tau\)之后和()相似程度,即()和()相似程度。
    A: 略
    \(x_n\)
    \(y_{n-\tau}\)
    \(x_n\)
    总结:\(x\)脚标值减去\(y\)脚标值就是\(\tau\). 所以也可以\(x_{n+m}y_{n+l}\)这样,\(m-l\)为常数\(\tau\)
  7. Q: 上面这个是“坐标变换”,和函数值做线性变换\(\alpha y+\beta\)不一样,回忆2. 我们实际中要爆搜()(这个没法直接解析做),对每个()解析求()。实际应用中,搜索空间可能更大,例如()
    A: \(\tau\)\(\tau\)\(\alpha,\beta\)
    更多维,旋转,缩放等更多坐标变换。
    注:实际工程中,这样就很复杂了,例如匹配二维码。相当于高维的比较复杂的优化(或说搜索)问题。而且可能整数点变成非整数点,还需要插值。
  8. Q: 实际利用相关拼接图片需要对比什么样的区域?
    A: 举例:比如先验知道重叠10%左右,那么看一张图的右边10%,和下一张的左边10%即可。
    拼接图应用:医疗,手机APP等。实际工程问题:一维?二维?图会不会太大?RGB中用哪个频道?
  9. Q: 利用“缩小10倍”的例子解释“亚像素成分”
    A: 大图2000乘3000,然后不在整十处裁出一个200乘300的小图,两个图各自缩小10倍,就出现了亚像素成分
    还原举例:抛物线插值。这里认为相关带来“轴对称性”(我在我自己左边等价于我在我自己右边)。

相关与褶积的关系

  1. Q: 简述相关用褶积、频谱、Z变换表示。
    A: \(r_{xy}(n) = x(n) * y(-n)\)(卷积脚标中换元得)
    频谱:注意\(y_{-n}\)频谱\(\bar Y(f)\),Z变换\(Y(1/Z)\)
    (注,以上针对实信号。否则需注意\(\bar y_{-n}\)频谱是\(\bar Y(f)\)
  2. Q: 用物理直观解释“自相关系数”和“能量”的关系。
    A: “自相关系数”如果没有标准化,那本身里面就体现了“总体”能量大小。
    进一步,考察“标准化”之后的相关系数,一个信号从0不断地“平移”一定周期时间后还和自己相关系数高。说明这个频率能量大。
    这都可以作为自相关函数频谱就是原信号能量谱的直观解释

8.2 相关函数的性质

  1. Q: 能量有限决定了()时,两个信号“失去相似性”
    A: 相对时移趋于无穷
  2. Q: 自相关函数为什么由()决定,和()谱无关?(从数学表达式形式上解释)
    A: 振幅,相位
    提示:频谱相乘出现\(X\bar X=|X|^2\)
  3. Q: 陶布利兹形矩阵:只需记忆\(\sum_l\sum_m a_la_mr_{xx}(l-m)\)即可。也就是针对脚标差,乘以对应的相关系数。该矩阵在()时正定。
    根据定义证明正定性时,直接做求和顺序交换仅能证明非负定。为了证明正定,需要把\(\sum x_n^2>0\)条件用在()。
    结合\(\sum_{l=0}^N a_l z^l\)至多\(N\)个0点或说()在区间()至多()即得“正”
    A: \(\sum x_n^2>0\)\(|X|\)不几乎处处为0(注:考察\([-1/2\Delta,1/2\Delta]\)
    \(\sum_{l=0}^N a_le^{-i2\pi l\Delta f}\)\([-1/2\Delta,1/2\Delta]\),N个零点
  4. Q: 从“对称”“0”“趋于无穷”“频谱”比较自相关和互相关
    A: \(r_{xy}(\tau) = r_{yx}(-\tau)\)
    由施瓦兹不等式,\(|r_{xy}(\tau)|\le \sqrt{r_{xx}(0)r_{yy}(0)}\)\(x=y\)时显然退化)
    趋于无穷:对于能量有限,当\(\tau\)趋于无穷时结果还是0
    频谱仍然有\(|R|=|X||Y|\)关系,故互相关函数只包含“共有频率成分”

进一步讨论

  1. Q: \(r\)是自相关函数的充分必要条件\(R(f)\ge 0\),这里要求\(r\)是实信号吗?
    A: 不一定。事实上,对于一般的\(R\)\(\sqrt R\)对应的信号不一定是实偶信号。只有\(R(f)=R(-f)\)才是特殊情况。
  2. 单边自相关函数*

8.3 循环相关和普通相关

  1. Q: \(\bar Y_m\)对应的有限离散信号是()(注意共轭导致的“反向”),故\(R_{xy}(m)\)可以表示为(),用卷积表示\(r_{xy}(n)\)为()
    A: \(y_{N-n}\)\(X_m\bar Y_m\)\(x_n*y_{N-n}[N]\)
  2. Q: 利用(周期变大为\(N\)的信号)循环相关计算普通相关:对于\(n<0\)可以()。由此如何理解\(\tilde r_{\tilde x\tilde y}(n) = r_{xy}(n-N),N-L<n\le N-1\)
    A: 利用互相关对称性
    左侧是循环相关,右侧是普通相关中\(n\)取负(且负得不是那么多)的情况。根据\(\tilde x\)是周期为\(N\)的信号画图容易看到。
  3. Q: 如何理解条件\(N-L\ge K\)\(N\ge 2M-1\)
    A: 对于只求\(0\le n\le K\)的互相关,我们只需要\(n\)始终满足\(0\le n\le N-L\)就可以使得循环相关不“出去”(这个针对\(x\)\(y\)具有不对称性)
    这里\(K\)越小,需要的\(N\)当然越小。
    对于\(L=M\)\(K=M-1\)(因为对于自相关,显然\(n\ge M\)处都是0),就变成特例\(N\ge 2M-1\)
    当然互相关在\(n\)很大时也都是0. 只不过课本没有特别强调。
    利用FFT

8.4 多道相关

  1. Q: 一般用什么标准选择标准信号\(\bar x\)?结果是什么?
    A: 使得(M道信号与标准信号)误差能量最小。
    M道信号的算术平均。
  2. Q: “能量比”“叠加”“未标准化相关系数”的名称来源分别是什么?
    A:
    能量比:\(\frac{M道误差信号能量}{总能量}\)
    叠加:把M道直接叠加所得信号的能量和上面的“能量比”表达式有密切关系。
    当然,看叠加所得信号的振幅就是“叠加振幅标准”
    未标准化相关系数:所有两两的(未标准化)相关系数相加。和之前两种标准也有密切联系。实际上,\(K\)等于叠加信号能量减去M道信号(各自)能量之和。这物理意义很清晰:如果相关,那么叠加起来能量“变大”很多。
  3. Q: 相对误差能量\(=\frac {M-1}M(1-R)\)和之前两道相关的公式有什么区别?
    A: 例如:之前两道相关相对误差能量除以的是某一道的能量,此处是除以所有道能量之和。
    提示:其实之前两道相关和这里的多道相关整个流程和思想都不同。比如这里没有\(\alpha\)系数待定(如果没做“规格化处理”),且先要做平均,等等。典型地,可以取两个完全一样的信号,看它们按之前两道相关的处理流程是怎么被考察的,再看现在按多道相关的处理流程是怎么被考察的,就可以看到联系和区别了。
  4. Q: 指定数值“标准”在实际中起到什么作用?
    A: 比如反映性能优劣,作为迭代中进度的指示,作为待优化目标,作为“feature”等。