记忆常用公式

0 前言

Latex符号与公式集合 - CSDN:相对较全的latex数学符号,包括基本运算、高级运算、集合运算、三角运算、占位宽度、关系运算符、箭头、矩阵、希腊字符、函数、其他杂七杂八。

1 高数部分

1.1 三角函数

1.1.1 三角函数的基本定义
1.1.2 三角恒等式

(一) 两角和与差

cos(α+β)=cosαcosβsinαsinβcos(αβ)=cosαcosβ+sinαsinβsin(α+β)=sinαcosβ+cosαsinβsin(αβ)=sinαcosβcosαsinβtan(α+β)=tanα+tanβ1tanαtanβtan(αβ)=tanαtanβ1+tanαtanβ

(二) 积化和差公式

cosαsinβ=12[sin(α+β)sin(αβ)]sinαcosβ=12[sin(α+β)+sin(αβ)]cosαcosβ=12[cos(α+β)+cos(αβ)]sinαsinβ=12[cos(α+β)cos(αβ)]

(三) 和差化积公式

sinα+sinβ=2sin(α+β2)cos(αβ2)sinαsinβ=2sin(αβ2)cos(α+β2)cosα+cosβ=2cos(α+β2)cos(αβ2)cosαcosβ=2sin(α+β2)sin(αβ2)

(四) 二倍角公式

sin2α=2sinαcosα=2tanα+cotαcos2α=cos2αsin2α=2cos2α1=12sin2αtan2α=2tanα1tan2α

(五) 半角公式

sin(α2)=±1cosα2cos(α2)=±1+cosα2tan(α2)=±1cosα1+cosα=sinα1+cosα=1cosαsinα=cscαcotα

(六) 辅助角公式

asinα+bcosα=a2+b2sin(α+φ)

其中,φ满足cosφ=aa2+b2,sinφ=ba2+b2

(七) 万能公式

sinα=2tan(α/2)1+tan2(α/2),cosα=1tan2(α/2)1+tan2(α/2),tanα=2tan(α/2)1tan2(α/2)

(八) 降幂公式

sin2α=1cos(2α)2,cos2α=1+cos(2α)2,tan2α=1cos(2α)1+cos(2α)

(九) 余弦定理

余弦定理表达式1 余弦定理表达式2 余弦定理表达式3
c2=a2+b22abcosγ cosγ=a2+b2c22ab cosγ=sin2α+sin2βsin2γ2sinαsinβ
b2=a2+c22accosβ cosβ=a2+c2b22ac cosβ=sin2α+sin2γsin2β2sinαsinγ
a2=b2+c22bccosα cosα=b2+c2a22bc cosα=sin2β+sin2γsin2α2sinβsinγ

1.2 导数

1.2.1 导数的定义式

f(x)=ddxf(x)=limΔx0f(x+Δx)f(x)Δx

1.2.2 常用函数的导数
  • 指数类函数

f(x)=axf(x)=axlna

f(x)=exf(x)=ex

  • 对数类函数

f(x)=logaxf(x)=1xlna

f(x)=lnxf(x)=1x

  • 正切函数

f(x)=tanxf(x)=sec2x=(1cosx)2

  • 反三角函数类

f(x)=arcsinxf(x)=11x2

f(x)=arccosxf(x)=11x2

f(x)=arctanxf(x)=11+x2

1.3 泰勒级数/泰勒展开

1.3.1 标准公式

(一)在x=0处展开(麦克劳林公式)

  • 佩亚诺余项

f(x)=f(0)+f(0)1!x+f(0)2!x2++f(n)(0)n!xn+o[xn]

  • 拉格朗日余项

f(x)=f(0)+f(0)1!x+f(0)2!x2++f(n)(0)n!xn+f(n+1)(ξ)(n+1)!xn+1

(二)在x=x0处展开

  • 佩亚诺余项

f(x)=f(x0)+f(x0)1!(xx0)+f(x0)2!(xx0)2++f(n)(x0)n!(xx0)n+o[(xx0)n]

  • 拉格朗日余项

f(x)=f(x0)+f(x0)1!(xx0)+f(x0)2!(xx0)2++f(n)(x0)n!(xx0)n+f(n+1)(ξ)(n+1)!(xx0)n+1

(三)含有Δx的展开(常用于论文中的近似)

f(x+Δx)=f(x)+f(x)1!Δx+f(x)2!Δx+

f(x0+Δx,y0+Δy)=f(x0,y0)+[fx(x0,y0)Δx+fy(x0,y0)Δy]+12![2fx2(x0,y0)Δx2+22fxy(x0,y0)ΔxΔy+2fy2(x0,y0)Δy2]+

1.3.2 常用的带有佩亚诺余项的麦克劳林公式

sinx=xx33!+x55!+o(x5)

cosx=1x22!+x44!+o(x4)

tanx=x+x33+2x515+o(x5)

arctanx=xx33+x55+o(x5)

ex=1+x+x22!+x33!+o(x3)

11x=1+x+x2+x3+o(x3)

11+x=1x+x2x3+o(x3)

(1+x)α=1+αx+α(α1)2!x2+α(α1)(α2)3!x3+o(x3)

ln(1x)=xx22x33+o(x3)

ln(1+x)=xx22+x33+o(x3)

注意:
1、记忆常见函数的泰勒展开时候要学会利用函数之间求导与积分的关系;
2、注意代换方法,比如知道ex的展开,也可以推导出e2x的展开。

1.3.3 常用的等价无穷小
x0 x0
sinxx,tanxx ex1x
ln(1+x)x ax1xlna,(a>0,a1)
1cosx12x2 (1+βx)α1αβx
arcsinxx xln(1+x)12x2
arctanxx ln(x+1+x2)x
1.3.4 两个重要极限
  • e的定义式(极限)

limx(1+1x)x=elimx0(1+x)1x=e

  • sinc函数在零点的值

limx0sinxx=1

1.4 数列

1.4.1 等差数列求和
1.4.2 等比数列求和

若数列{an}为等比数列,且首项为a1,公比为q,前n项和为Sn,则有:

  • 当公比为q=1时:

Sn=na1

  • 当公比q1时:

Sn=a1(1qn)1qSn=a1anq1q

1.4.3 常见其他数列求和
  • an=n2的求和公式

Sn=i=1nai=n(n+1)(2n+1)6

  • 复指数求和

在计算序列的DFT时候,经常碰到如下形式的求和:已知序列x(n)=[1,1,1,1,1,0,0,0,0,0],求该序列的DFT。

X(k)=n=09x(n)exp{j2π10kn}=n=04x(n)exp{j2π10kn}=1exp{j2π10k5}1exp{j2π10k}

重点是该分式如何进一步化简,其主要思路参考【信号与系统:如何化简、计算两个复指数的和/差 - bilibili】,简单来说,核心思想是提取和(差)式的两个指数的频率的平均值

1exp{j2π10k5}1exp{j2π10k}=exp{j2π10k52}(exp{j2π10k52}exp{j2π10k52})exp{j2π10k12}(exp{j2π10k12}exp{j2π10k12})=exp{j2π10k2}sin(π2k)sin(π10k),k=0,1,,9

1.5 积分

1.5.1 积分换元

(一) 积分换元

积分换元需要考虑下面三个方面:

  • 旧元换新元;
  • 积分限变化;
  • 雅可比行列式;

下面重点说一下雅可比

假设我们要用换元法计算下面的积分:

f(x,y) dxdy

所要换的元为

{x=x(u,v)y=y(u,v)

我们把

J=|(x,y)(u,v)|=|xuxvyuyv|

那么就可以把这个积分写成:

f(x,y) dxdy=f[x(u,v),y(u,v)]|J| dudv

特别要注意:雅可比行列式要加绝对值

再比如,用极坐标的积分变换:

{x=rcosθy=rsinθ

我们发现xy都是关于rθ的二元函数,因此:

|(x,y)(r,θ)|=|cosθrsinθsinθrcosθ|=r

所以:

f(x,y) dxdy=f(rcosθ,rsinθ)r drdθ

我们也可以把这个结论拓展到三维情况,这个交给读者自行推导,这里给出结论:

若:

{x=x(u,v,w)y=y(u,v,w)z=z(u,v,w)

则:

|(x,y,z)(u,v,w)|=|xuxvxwyuyvywzuzvzw|

带回计算,得:

f(x,y,z) dxdydz=f[x(u,v,w),y(u,v,w),z(u,v,w)]|(x,y,z)(u,v,w)| dudvdw

(二) 离散求和换元

离散求和换元比积分换元要简单,只需考虑下面两个方面即可:

  • 旧元换新元;
  • 积分限变化;

积分换元参考资料:
浅谈雅可比行列式和积分换元的原理 - EnemyIncoming - Bilibili

1.5.2 变限积分求导公式

ddxaxf(t) dt=f(x)

ddxxbf(t) dt=f(x)

ddxaφ(x)f(t) dt=f(φ(x))ddxφ(x)

ddxψ(x)φ(x)f(t)dt=ddx[ψ(x)af(t)dt+aφ(x)f(t)dt]=f(φ(x))ddxφ(x)f(ψ(x))ddxψ(x)

1.5.3 重要积分

(一) 复指数函数积分

eikxdx=2πδ(k)

可以从δ(t)的傅里叶变换推导。

(二) 伽马Γ函数积分

Γ函数的定义:

Γ(α)=0xα1ex dx

容易证得,该积分对于α>0均收敛。

Γ函数的性质:

  • (1) Γ(1)=1,Γ(12)=π

  • (2) Γ(α+1)=αΓ(α)

  • (3) Γ(n+1)=n!,nN

Γ函数的另一种形式:

Γ(α)=20x2α1ex2 dx

特别注意Γ函数的各种变形。

1.6 重要不等式

1.6.1 柯西-施瓦茨不等式
  • 二维形式

ac+bd(a2+b2)(c2+d2)

等号成立条件:当且仅当ad=bc

  • 三角形式

a2+b2+c2+d2(ac)2+(bd)2

等号成立条件:ad=bcac+bd0

  • 概率形式

(E(XY))2E(X2)E(Y2)

等号成立条件:当且仅当P(X+kY=0)=1时,"="成立

  • 积分形式

(f(x)g(x) dx)2f2(x) dxg2(x) dx

等号成立条件:f(x)=kg(x)

  • 向量形式

(x,y)2(x,x)(y,y)

等号成立条件:x=ky

1.6.2 均值不等式

均方根QM 算术平均AM 几何平均GM 调和平均HM

x12++xn2nx1++xnnx1xnnn1x1++1xn

当且仅当x1=x2==xn时,取"="

1.7 复数的运算法则

1.7.1 复数表示方法

复数主要有三种表示方法:直角坐标系表示,极坐标系表示,三角函数表示

z=a+ib=reiφ=r(cosφ+isinφ)

其中,ab 表示复数的实部和虚部,rφ 表示复数的模长和辐角。根据定义,可以看到其关系为:

{a=rcosφb=rsinφ

1.7.2 复数的四则运算、共轭运算、模长运算

(1) 基本四则运算

z1=a+ibz2=c+id 是任意两个复数,则其基本四则运算为:

  • 加法运算,复数的加法按照以下规定的法则进行:

z1+z2=(a+ib)+(c+id)=(a+c)+i(b+d);

  • 减法运算,复数的减法按照以下规定的法则进行:

z1z2=(a+ib)(c+id)=(ac)+i(bd)

  • 乘法运算,复数的乘法按照以下的法则进行:

z1×z2=(a+ib)×(c+id)=(acbd)+i(bc+ad)

  • 除法运算,复数的除法是通过分母实数化来计算:

z1z2=z1×z¯2z2×z¯2=(a+ib)×(cid)(c+id)×(cid)=(ac+bd)+i(bcad)c2+d2

(2) 基本共轭运算

  • 共轭运算,复数的共轭按照以下的法则进行:

z¯=aib=reiφ=r(cosφisinφ)

(3) 基本模长运算

  • 模长是将复数的实部与虚部的平方和的正的平方根的值称为该复数的模:

|z|=a2+b2=r

(4) 混合运算

  • 复数加减运算后取共轭

z1±z2=z¯1±z¯2

  • 复数乘除运算后取共轭

z1×z2=z¯1×z¯2(z1z2)=z¯1z¯2

小结1:R(z1,z2,,zn)表示 n 个复数基本四则运算的组合,则它满足规律 :
R(z1,z2,,zn)=R(z¯1,z¯2,,z¯n)

  • 复数相乘运算后取模长

|z1×z1|=|z1|×|z1||n=1Nzn|=n=1N|zn|

  • 复数相除运算后取模长

|z1z2|=|z1||z2|

小结2: 复数模长的一些性质
  • |Re(z)||z|,|Im(z)||z|

  • |z||Re(z)|+|Im(z)|

  • |z|2=|z¯|2=z×z¯

  • |z1||z2||z1±z2||z1|+|z2|

  • |z1+z2++zn||z1|+|z2|++|zn|

  • |z1+z2|2+|z1z2|2=2(|z1|2+|z2|2)

1.8 集合

1.8.1 一些基本概念

(一) 属于与包含

属于是指元素与集合的关系,包含是指集合与集合间关系。属于和包含的区别是:

  • (1)属于用符号表示:若元素a是集合A的元素,则称a属于A,记为aA

  • (2)包含是集合与集合间关系,包含于用符号表示:若集合B是集合A的子集,则称B包含于A,记为BA

    • 注意1,集合B是集合A的子集也可以用包含符号表示,称A包含B,记为AB

    • 注意2,表示真包含于,表示包含于 —— B真包含于AB不可以等于AB包含于AB可以等于A

    • 注意3, 一般情况下,这三个符号都表示真包含于 —— 其中,是真包含于的正统符号,不是规范符号(课本没有这个符号,有时候题目有出现,是真包含于的意思),表示空间几何直线、平面之间的位置关系,如lα:直线l在平面α内。

    • 注意4,这个符号有一定歧义,有的书上是真包含于(常用),有的是包含于。

(二) 常见集合符号

集合符号 释义
空集
N 全体非负整数的集合,简称非负整数集(或自然数集)
N+orN 非负整数集内排除0的集,也称正整数集
Z 全体整数的集合,通常称作整数集
Q 全体有理数的集合,通常简称有理数集
R 全体实数的集合,通常简称实数集
C 全体复数的集合,通常简称复数集
1.8.2 集合的笛卡尔乘积

(一) 定义

AB为集合,AB的笛卡儿积记作A×B

A×B={(x,y)xA,yB}

例题:设A={1,2}B={a,b,c},则A×BB×A分别为:

A×B={(1,a),(1,b),(1,c),(2,a),(2,b),(2,c)}B×A={(a,1),(a,2),(b,1),(b,2),(c,1),(c,2)}

推广:A1,A2,,Ann个集合,则n阶笛卡尔积为:

A1×A2××An={(x1,x2,,xn)xiAi,i=1,2,,n}

如:(1,1,0)3维空间中的一个矢量,则可称(1,1,0)R×R×R

(二) 笛卡儿积的性质

  • (1)若AB中有一个为空集,则A×B就是空集:A×=×B=

  • (2)不适合交换律:A×BB×A,AB,A,B

  • (3)不适合结合律:(A×B)×CA×(B×C),A,B,C

  • (4)对并或交满足分配律:A×(BC)=(A×B)(A×C)A×(BC)=(A×B)(A×C)

  • (5)若|A|=m,|B=n|,则|A×B|=mn

1.8.3 测度论简介

参考链接1:【测度论】Ch1. 问题引入 - Dylaaan的文章 - 知乎
参考链接2:概率论中零测集的意义是什么? - 知乎
参考链接3:实分析与复分析零测集所起的作用 - 百度文库
参考链接4:零测集的概念及性质 - 未知来源
参考链接5:Lebesgue零测度 - CSDN
参考链接5:为什么有理数测度为0? - 知乎

2 概率部分

2.1 常用的统计分布模型

2.1.1 离散分布模型

(一) 两点分布(伯努利分布/0-1分布)——XBern(p)

  • 分布函数与密度函数

随机变量X只可能取 0 or 1 两个值,其分布函数为:

P(X=k)=pk(1p)1k,k=0,1

  • 期望与方差

E(X)=pD(X)=p(1p)

(二) 二项分布——XB(n,p)

  • 分布函数与密度函数

P(X=k)=Cnk pk(1p)nk

  • 期望与方差

E(X)=npD(X)=np(1p)

  • 二项分布的性质

(1) 如果XB(n,p)YB(m,p),且XY相互独立,那么X+Y也服从二项分布,它的分布为:

X+YB(n+m,p)

(2) 伯努利分布是二项分布在n=1时的特殊情况。XB(1,p)XBern(p)的意思是相同的。相反,任何二项分布B(n,p)都是n次独立伯努利试验的和,每次试验成功的概率为p

(3) 泊松近似,当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ=np的泊松分布可以作为二项分布B(n,p)的近似,近似成立的前提要求n足够大,而p足够小,np不是很小。

二项展开式: (a+b)n=r=0nCnranrbr
排列/组合数计算: Anm=n!(nm)!,Cnm=Anmm!=n!m!(nm)!
组合数性质:Cnm=CnnmCn+1m=Cnm+Cnm1Cn0=1

(三) 泊松分布——XP(λ)

  • 分布函数与密度函数

P(X=k)=λkk!eλ,k=0,1,2,

  • 期望与方差

E(X)=λD(X)=λ

2.1.2 连续分布模型

(一) 均匀分布——XU(a,b)

  • 分布函数与密度函数

f(x)={1ba, a<x<b0, 其他

F(x)={0, x<axaba, a<x<b1, x>b

  • 期望与方差

E(X)=a+b2D(X)=(ba)212

(二) 指数分布——XExp(λ)

  • 分布函数与密度函数

f(x)={λeλx, x>00, x0

F(x)={1eλx, x>00, x0

  • 期望与方差

E(X)=1λD(X)=1λ2

(三) 正态分布——XN(μ,σ2)

  • 分布函数与密度函数

f(x)=12πσexp((xμ)22σ2)

-期望与方差

E(X)=μD(X)=σ2

  • 二维联合正态分布

假设(X,Y)(μ1,μ2,σ12,σ22,ρ),则其联合概率密度函数为:

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)((xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22)}

其中ρXY之间的相关系数,σX>0σY>0。在这种情况下

μ=(μXμY),Σ=(σX2ρσXσYρσXσYσY2)

  • 多元正态分布

fx(x1,,xk)=1(2π)k|Σ|e12(xμ)TΣ1(xμ)

注意这里的|Σ|表示协方差矩阵的行列式。

  • 高斯分布的几个重要性质

① 根据高斯函数性质知,两个高斯函数卷积的结果仍为高斯函数;

② 高斯函数的一个积分性质:xexp{(Ax+b)2} dx=Const

③ 边缘和条件高斯分布:给定x的边缘高斯分布和yx下的条件高斯分布,则可以推导出y的边缘分布:

p(x)=N(x|μ,Λ1)p(y|x)=N(y|Ax+b,L1)p(y)=N(y|Aμ+b,L1+AΛ1AT)

详细关于高斯正态分布乘积、卷积的公式证明请参考:高斯函数与正态分布乘积与卷积的性质 - 小信号 - 博客园强推,写的不错!!!

(四) 瑞利分布

瑞利分布(Rayleigh distribution),又译为莱利分布,当一个随机二维向量的两个分量呈独立的、有着相同的方差、均值为0的正态分布时,这个向量的模呈瑞利分布。例如,当随机复数的实部和虚部独立同分布于0均值,同方差的正态分布时,该复数的绝对值服从瑞利分布。该分布是以瑞利命名的。

  • 概率密度函数与分布函数

fZ(z;σ)=zσ2exp(z22σ2),z0

FZ(z)=1exp(z22σ2)

-期望与方差

E(Z)=π2σD(X)=4π2σ2

2.2 几个重要性质

2.2.1 全概率公式

P(A)=iP(A|B=bi)P(B=bi)

2.2.2 全期望公式

E(A)=iE(A|B=bi)P(B=bi)

2.2.3 重期望公式

E(E(XY))=E(X)

2.3 各种矩估计函数的性质

2.4 相关函数及协方差函数

常用函数 表达式
数学期望 μX(t)=E[X(t)]
方差函数 σX2=E[X(t)μX(t)]2
自相关函数 RX(t1,t2)=E[X(t1)X(t2)]
协方差函数 CX(t1,t2)=Cov[X(t1),X(t2)]=E[(X(t1)μX(t1))(X(t2)μX(t2))]
相关/协方差函数 表达式
自协方差 CX(t1,t2) = E([X(t1) μX(t1)][X(t2) μX(t2)]) = E[X(t1)X(t2)] μX(t1)μX(t2)
互协方差 CXY(t1,t2) = E[X(t1) μX(t1)][Y(t2) μY(t2)]
自相关函数 RX(t1,t2) = E[X(t1)X(t2)]
互相关函数 RXY(t1,t2) = E[X(t1)Y(t2)]
注1:特别的若{X(t),tT}的期望函数为0,则协方差函数和自相关函数相等。若X(t1),X(t2)随机程的两状态相互独立,则有CX(t1,t2)=0

注2:特别的若X(t),Y(t)之一的期望为0,则互协方差等于互相关函数。若X(t),Y(t)相互独立,则CXY(t1,t2)=0X(t),Y(t)称为互不相关的。相互独立的两个随机过程必是互不相关的。反之如果互相关的不一定相互独立。
谱密度函数 表达式
自谱密度函数 SX(ω)=RX(τ)ejωt dτ
互谱密度函数 SXY(ω)=RXY(τ)ejωt dτ
注:谱密度函数就是相关函数的傅里叶变换式;反之,相关函数就是谱密度函数的傅里反变换。
2.4.2 随机向量期望与协方差

此处仅给出在经典统计学意义下的随机向量(不考虑在测度论框架下的随机向量定义),即此处的随机向量的各个分量均为随机变量,且均值为μ,方差为σ2,则我们可以按如下方式来定义一个随机向量:

定义 1 :设X=[X1,X2,,Xn]T为随机向量,若其每个分量Xi为随机变量,且称Xn×1随机向量,记E(X)=[E(X1),E(X2),,E(Xn)]TX的均值。

定义 2 :称Cov(X)=E[(XEX)(XEX)T]X的自协方差矩阵,自协方差矩阵必为半正定对称矩阵

cij=Cov(Xi,Xj)=E[(XiEXi)(XjEXj)],i,j=1,2,,n

Cov(X)=[c11c12c1nc21c22c2ncn1cn2cnn]

定义 3 :设XY分别为n×1m×1随机向量,称Cov(X,Y)=E[(XEX)(YEY)T]XY的协方差矩阵。

3 线性代数/矩阵论部分

3.1 转置和逆

(AB)T=BTAT

(AB)1=B1A1

(AT)1=(A1)T

A=(A1A2A3A4A5A6A7A8A9)AT=(A1TA4TA7TA2TA5TA8TA3TA6TA9T)

  • Penrose的广义逆矩阵

设矩阵ACm×n,若矩阵XCn×m满足以下4个Penrose方程:

AXA=AXAX=X

(AX)H=AX(XA)H=XA

则称XA的Moore-Penrose逆(伪逆),记为A

  • 矩阵求逆公式

(A+BCD)1=A1A1B(C1+DA1B)1DA1

3.2 矩阵和向量求导

输入向量有的地方使用列向量,也有的使用行向量,其实本质上没有什么不同,只是表示方式不一样。一般情况下可能都是使用分母布局,就是求导结果按照分母列向量的形式排列(默认向量都是列向量)。

3.2.1 向量对向量求导

xx=I,Axx=AT,xTAx=A,xTAxx=(A+AT)x=A2Ax

ATr(BA)=BT,AlogdetA=(A1)T

3.2.2 标量对向量求导

yx=[yx1yxp]=y

参考链接:

(xTa)x=(aTx)x=a

其中,a为常数列向量。

(xTx)x=2x

矩阵求导公式的数学推导(矩阵求导——基础篇) - Iterator的文章 - 知乎

3.2.3 迹的求导

(一)迹的定义

设矩阵A为方阵,即An×n,矩阵B也为方阵Bn×n,则矩阵的迹为:

tr(A)=i=1naii=i=1nλn

(二)性质

  • tr(AB)=tr(BA)

  • tr(A)=tr(AT)

  • Atr(AB)=AT

  • Atr(ABATC)=CAB+CTAAT

3.3 求方阵的n次方方法总结

3.3.1 对角化

若矩阵A可以相似对角化后,那么先相似对角化再求An,这属于常规思路。

(一)矩阵可对角化的条件(3个)

  • n阶矩阵可对角化的充分必要条件是有个线性无关的特征向量。若 阶矩阵定理2 矩阵 的属于不同特征值的特征向量是线性无关的。

  • n阶矩阵有个互不相同的特征值,则可对角化。

  • n阶矩阵可对角化的充分必要条件是:每个特征值对应的特征向量线性无关的最大个数等于该特征值的重数(即的每个特征值对应的齐次线性方程组的基础解系所含向量个数等于该特征值的重数,也即的每个特征子空间的维数等于该特征值的重数)。

(二)矩阵对角化

n×n矩阵有n个线性无关的特征向量x1,x2,,xn,令矩阵S=(x1,x2,,xn),则有

AS=A(x1,,xn)=(λ1x1,,λnxn)=(x1,,xn)(λ1λn)

即,矩阵可对角化为

AS=SΛS1AS=Λ

3.4 矩阵特征值求解

3.4.1 特征值分解理论基础

An阶矩阵,若数λn维非0列向量x满足Ax=λx,那么数λ称为A的特征值,x称为A的对应于特征值λ的特征向量。式Ax=λx也可写成(AλE)x=0,并且|λEA|叫做A的特征多项式。当特征多项式等于0的时候,称为A的特征方程,特征方程是一个齐次线性方程组,求解特征值的过程其实就是求解特征方程的解。

3.4.2 特征值分解实例计算

例子1:计算矩阵A=(460350361)的特征值和特征向量

解:

  • STEP 1:计算|AλI|

|AλI|=|4λ6035λ0361λ|=(λ1)2(λ+2)=0

解得:λ1=2,λ2=λ3=1

  • STEP 2: 把每个特征值λ带入到下方的线性方程组(AλI)x=0,求出特征向量

(1) 当λ1=2时,解线性方程组:(A(2)I)x=0

|A+2I|=(660330363)先变成增广矩阵(660033003630)再初等行变换(110000000110)

所以,{x1+x2=0x1+x3=0。可以看到x3为自由变量,因此:

x3=1,可解得{x1=1x2=1x3=0,所以λ1的特征向量为:p1=(111)

(2) 当λ2=λ3=1时,解线性方程组:(AI)x=0

|AI|=(360360360)先变成增广矩阵(360036003600)再初等行变换(120000000000)

所以,x1+2x2=0。可以看到x2x3为自由变量,因此:

先取x2=1x3=0,可解得{x1=2x2=1x3=0,所以λ2的特征向量为:p2=(210)

再取x2=0x3=1,可解得{x1=0x2=0x3=1,所以λ3的特征向量为:p3=(001)

综上所述:矩阵A的特征值为λ1=2λ2=λ3=1,对应的特征向量为:

p1=(111),p2=(210),p3=(001)

3.5 线性变换/基变换

参考资料:
3 相似与对角化 - 御手洗洁精的文章 - 知乎
求线性变换A在基下的矩阵 - 豆瓣:实例计算!
线性变换在不同基下的矩阵相同吗
为什么基变换是右乘一个过渡矩阵,而不是左乘一个过渡矩阵? - 王涛的回答 - 知乎
变换矩阵的左乘与右乘区别 - CSDN
基变换与坐标变换 - 原创力文档

3.6 正定矩阵

3.6.1 正定矩阵定义
3.6.2 正定矩阵性质
3.6.3 正定矩阵意义

看论文,看书,总是会发现突然作者来一句,我们可以证明矩阵正定,所以balabala。证明如下…

往往这个时候,我们会很纳闷,上网一搜,会发现都是证明矩阵正定的各种方法,而很少有人去讨论,到底为什么我们要去证明一个矩阵是正定的,以及矩阵正定到底意味着什么。然后往往看了一大圈回来还是一脸问号。

那今天本文就非常简单的定性讨论下为什么大家要去证明一个矩阵是正定的,以及正定的意义。

(一) 可以将正定矩阵理解为矩阵版标量正系数

在标量中:y=ax,当a>0时,y将与x的正负号相同,即如果x>0y>0x<0y<0。与a相乘不会改变正负号。

那该性质如何在多维空间中表示呢?这里我们说,简单理解正定矩阵便是符合标量中a性质的矩阵。

也则是xTAx>0的含义。A正定,则其中一个性质是Ax同向夹角小于九十度,所以Ax将会与x同向,而不会将x变换到与之完全相反的方向。

总结:在标量空间中我们有y=ax, 我们可以规定a>0。而在多维空间中,y=Ax, 我们定义矩阵"A>0"的方式便是正定,而矩阵A>0不能这么定义,xTAx>0便是正确的定义方式,其在标量空间中等价于 a>0

正定矩阵意味着对于任意向量的变换后夹角都是锐角,这意味着对于任何的迭代(优化、搜索)过程,迭代前后两个点充分的近。除了优化外,在微分方程迭代计算中,一般状态迭代矩阵满足M=E+ΔUΔU是微分矩阵近似得到的差分矩阵,通常都是正定的,这样才能保证变化的微小型,从而确保迭代的稳定性。

(二) 系统(求解的问题)具有全局最小值

从系统角度看,如果一个矩阵是正定的,那么我们可以简单理解这个系统拥有全局最小值。而绝大部分问题都可以抽象为解决一个优化问题,如果能证明或者将问题用正定矩阵表示,那么从理论上该问题便拥有全局最优解。

比如如果矩阵二阶导为正定矩阵xTAx>0,则证明其具有局部最小值解,反之xTAx<0,则证明其具有局部最大值解,如果不满足上述两种则证明函数会有鞍点(saddle point)。

从上图可以看A为最小值,B为鞍点,C为最大值。

而如果理论上拥有全局最优解,便会给我们使用很多已知成熟的方式去求解最优值的方法,(简单举个例子:比如使用Hessian矩阵求解最优等),这也是机器学习,优化问题最喜欢去研究和解决的情况。

(三) 数学角度

从数学视角看,当我们说矩阵正定,相当于对矩阵做了相当强的一种限制,那么在这个限制里就会发现相当多有趣的性质,另外有许多矩阵是正定的,比如协方差矩阵,动力矩阵等等。这就给了数学家研究归纳性质的强烈兴趣。

上文转载自:一个矩阵正定(Possitive definite) 到底能说明什么,能解决什么问题? - 若辰的文章 - 知乎

其他比较好的文章:正定矩阵的几何意义 - Flyingpie的文章 - 知乎

3.7 矩阵行列式的相关性质

(一) The Matrix Determinant Lemma(MDL)定理

|A+BC|=|A||I+A1BC|=|A||I+CA1B|

|A+uvT|=|A||1+vTA1u|

(二)

当矩阵A(t)可逆时,有如下:

ddtlogdetA(t)=ddtlog|A(t)|=trace(A1ddtA(t))

4 微分方程

4.1 常数变异法

求解非齐次线性微分方程的常用方法便是常数变易法,下面,我们首先以一阶非齐次线性微分方程来引入常数变易法。

dydx+P(x)y=Q(x)

我们联想一阶齐次线性微分方程的解法:

dydx+P(x)y=0

分离变量法:

  • STEP 1:两边同时除以ydyy=P(x)dx

  • STEP 2:两边积分得:lny=P(x)dx+C

  • STEP 3:求的结果:y=CeP(x)dx

下面进行常数变异:CC(x)

接下来就是将y=C(x)eP(x)dx带回dydx+P(x)y=Q(x),求解出C(x)

最后,根据初始条件,得到解。

4.2 拉普拉斯变换

拉普拉斯变换的导数定理(见拉普拉斯变换)使得我们可以把常系数线性微分方程化为代数方程,不论是否齐次。在常系数齐次线性微分方程中,我们通过把方程写为算子ddt的代数方程,实现了化微分方程为代数方程,但这种操作对非齐次方程没有用。拉普拉斯变换是另一种化为代数方程的思路,而且不拘泥于齐次与否。

4.2.1 拉普拉斯变换的导数定理

[0,+]上有k次可导函数f(t),其拉普拉斯变换为:

L(f(t))=F(s)=0f(t)estdt

则有

L(ddtf(t))=sF(s)f(0)

进一步推广的到2阶:

L(d2dt2f(t))=sL(ddtf(t))f(0)=s2F(s)sf(0)f(0)

4.2.2 函数乘以一个指数函数后的拉普拉斯变换

对于f(t),若设其拉普拉斯变换为F(s),则

L(eatf(t))=F(sa)

4.2.3 常见信号的拉氏变换

L(δ(t))=1L(1)=1sL(tm)=m!sm+1L(eat)=1s+a

常见Laplace拉氏变换对公式表及反变换法 - 百度文库
常用拉氏变换表 - 博客园
冲激偶 的 拉普拉斯变换 - 八卦掌的文章 - 知乎

4.2.4 利用拉普拉斯变换求解常系数微分方程

例子1: 求方程x3x+3x+x=1的满足初始条件x(0)=x(0)=x(0)的解。

解:根据初始条件对方程两端进行Laplace变换得:

(s3+3s2+3s+1)X(s)=1sX(s)=s3+3s2+3s+1s

把上式分解为:

X(s)=1s1s+11(s+1)21(s+1)3

进行逆Laplace变换得:

x(t)=1ettet12t2et

参考链接:拉普拉斯变换求解微分方程(组)典型范例
部分分式展开法

5 物理部分

5.1 散度旋度定理与几个重要等式

5.1.1 散度定理
散度 旋度
div F=limΔV0SFdSΔV rot F=limΔS0lFdlΔS
5.1.2 哈密顿算子

=xex+yey+zez

哈密顿算子的两个性质:矢量性微分性

4.1.3 拉普拉斯算子

(一) 标量拉普拉斯算子——2μ

2u=(u)

在直角坐标系中的展开形式

2=2x2+2y2+2z2

(二) 矢量拉普拉斯算子——2A

简记为“旋了又旋(玄了又玄)”

2A=(A)×(×A)

注意:不要把拉普拉斯算子中的上角标看成是“平方”,因为一是本身的意义就不是平方,二是这就是一个符号。

5.1.4 几个重要算式

(1) 变换1:(A×B)=B(×A)A(×B)

(2) 变换2:×uA=u×A+u×A

(3) 恒等式1:×(u)0

(4) 恒等式2:(×A)0

5.2 麦克斯韦方程组

6 信号处理部分

6.1 常用傅氏变换及其性质

信号与系统”常用变换对及性质梳理 - 王老师 - 百度网盘

【重要知识】常用信号的傅里叶变换+重要口诀总结 - Bilibili

信号与系统 - Wreng - 博客园:总结了傅里叶变换和拉普拉斯变换的基础知识。

Vinson88 - 博客园:这个博主主要记录了几篇(数字)信号处理、通信方向的知识,其中有几篇博客文章正好是我比较疑惑的问题,可以看看该博主的见解。

6.2 常见信号的运算

6.2.1 常见的信号空间

(一) 希尔伯特空间

希尔伯特空间(Hilbert space)指的其实就是完备的内积空间,即希尔伯特空间是一种特殊的内积空间,其特殊性就体现在其完备性上,因为一个内积空间不一定是完备空间。而非完备的内积空间又称为准希尔伯特空间(pre-Hilbert space)。

那么,这其中包含有两个概念,即:“完备空间”和“内积空间”,两者的交集即为“完备的内积空间”,下面分开进行解释。

(二) 完备空间

在数学分析中,完备空间又称完备度量空间或称柯西空间(Cauchy space)。如果一个度量空间M中的所有柯西序列都收敛在该空间M中的一点,则称该空间M为完备空间。

这个定义中又涉及到两个的概念,即“度量空间(Metric space)”和“柯西序列(Cauchy sequence)”

  • 度量空间

在数学中,度量空间是个具有距离函数的集合,该距离函数定义集合内所有元素间之距离。此距离函数被称为集合上的度量。度量空间中最符合人们对于现实直观理解的是三维欧几里得空间(Euclidean space)。

这里的“距离”是一个抽象概念,不仅仅指两点间的直线距离,还包括向量距离、函数距离、曲面距离等。定义为:

W是一个非空集合,对中任意两点xy,在度量d的作用下,有一实数d(x,y)与该两点对应且满足:

(1) 正定性:d(x,y)0,当且仅当x=y时取等号;
(2) 对称性:d(x,y)=d(y,x)
(3) 三角不等性:d(x,y)d(x,z)+d(y,z)

那么就称d(x,y)W中的一个距离(度量),称W为一个对于度量d而言的度量空间。

  • 柯西序列

在数学中,柯西序列、柯西列、柯西数列或基本列是指这样一个数列,它的元素随着序数的增加而愈发靠近。任何收敛数列必然是柯西列,任何柯西列必然是有界序列。

完备性

前面提到“如果一个度量空间M中的所有柯西序列都收敛在该空间M中的一点,则称该空间M为完备空间。”可以把实数和有理数作为具体的例子。由实数R定义的序列在通常定义的距离意义下是完备的。而由有理数Q定义的序列在通常定义的距离意义下则不是完备的。

例如一个由有理数构成的序列:x0=1,xn+1=12(xn+xn2),也即:(1,32,1712,),可以用巴比伦方法证明其结果收敛于2Q

说了这么多,用一句通俗但不严谨的话来表达就是:通常见到的空间中,实数空间是完备空间

(三) 内积空间

指的是添加了一个“运算方法”(或称“结构”)的向量空间(或称为“线性空间”,两者同义),这个新添加的运算方法即“内积(Inner product)”又称“标量积(Scalar product)”或称“点积(Dot product)”。内积将一对向量与一个纯量连接起来,允许我们严格地谈论向量的“夹角”和“长度”,并进一步谈论向量的正交性。

这其中又涉及了“向量空间(Vector space)”的概念。

而且,内积空间具有基于空间本身的内积所自然定义的范数,x=x,x,且其满足平行四边形定理,也就是说内积可以诱导一个范数,所以内积空间一定是“赋范空间”。这其中又涉及了“赋范空间(Normed vector space)”的概念。 一步一步来,先说说向量空间(或称“线性空间”,两者同义)。

  • 向量空间

一般向量空间的定义如下:定义在一个域F(例如,实数域R、复数域C)上的向量空间V是由向量组成的一个集合,并赋予该集合向量与向量之间的加法:V+VV ;和标量与向量之间乘法:F×VV 。向量空间中向量加法与标量乘法运算满足基本的8条性质(自行去网上检索,这里不再列出)。

8条性质中并不包含向量与向量之间的乘法。而这也是正是内积作为区别内积空间与一般向量空间的附加条件的原因。这也是为什么内积空间包含三个运算:向量与向量之间的加法,标量与向量之间的乘法,以及向量与向量之间的乘法。 在了解了向量空间的基础上,再反过头来,补充一下赋范空间的概念和这几个空间之间的关系。由于赋范空间定义在向量空间的基础之上,所以也称为线性赋范空间,简称赋范空间。注意,前面提到向量空间就是线性空间,两者同义。

  • (线性)赋范空间

范数常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。其定义是:设V是定义在一个域F上的向量空间,函数作用于V,且满足条件:

(1) 正定性:xV,x0,当且仅当x=0时取等号;
(2) 齐次性:xV,αF,有αx=|α|x
(3) 三角不等式:x,yV,有x+yx+y

V上的一个范数,定义了范数的向量空间V称为(线性)赋范空间。通过将赋范空间和上面的度量空间相比较,可知“范数”与“距离”之间的区别有:

① 距离(或称“度量”)是定义在任意非空集合上的,而范数则定义在向量空间上;
② 在向量空间中,范数可以诱导距离(或称“度量”),反之不成立,这也意味着赋范空间一定属于度量空间;
③ 范数的“齐次性”表明范数可以看做是强化后的距离概念。

(四) 总结

说了这么多感觉有点乱,所以再总结一下各个空间之间的关系:

  • 范数运算 + 向量空间 = (线性)赋范空间

  • (线性)赋范空间 + 内积运算 = 内积空间

  • (线性)赋范空间 + 完备性 = 巴拿赫空间

  • 内积空间 + 完备性 + 有限维 = 欧几里得空间

  • 内积空间 + 完备性 = 希尔伯特空间

最后补充一句:希尔伯特空间(Hilbert space)是有限维欧几里得空间(Euclidean space)的一个推广,使之不局限于实数的情形和有限的维数,但又不失完备性(不像一般的非欧几里得空间那样破坏了完备性)。

而且从上面的关系可知,希尔伯特空间可以看做是增加了内积运算的巴拿赫空间(Banach space)。

参考链接1:希尔伯特空间、内积空间的定义有什么关系和区别? - 李狗嗨的回答 - 知乎
参考链接2:如何理解希尔伯特空间? - TimXP的回答 - 知乎
参考链接3:希尔伯特空间 - yang的文章 - 知乎
参考链接4:向量的夹角为什么可以用内积来算,是巧合吗? - 川南雁的回答 - 知乎

6.2.2 内积

任意信号x(t)y(t)的内积定义为:

x(t),y(t)=x(t)y(t)dt

特别的,对于实信号x(t)y(t)的内积定义为:

x(t),y(t)=x(t)y(t)dt

时域内积等于频域内积:设信号x(t)y(t)的傅氏变换为X(f)Y(f),则有:
x(t)y(t)dt=X(f)Y(f)df 如果两个信号在时域正交,那么它们在频域也是正交的。
信号能量与内积的关系:信号能量是信号与其自身的内积:
Ex=|x(t)|2dt=x(t)x(t)dt
互能量与内积的关系:两个信号的内积也称为互能量:
Exy=x(t)y(t)dtEyx=y(t)x(t)dt

此时,有:

Exy=Eyx

特别的,对于实信号:

Exy=Eyx

6.2.3 相关函数

能量信号x(t)y(t)的互相关函数:

Rxy(τ)=x(t)y(t+τ)dtRyx(τ)=y(t)x(t+τ)dt

特别的,对于实信号的互相关函数:

Rxy(τ)=x(t)y(t+τ)dtRyx(τ)=y(t)x(t+τ)dt

互相关函数的共轭对称性: Rxy(τ)=Ryx(τ)

实信号互相关函数的对称性:

Rxy(τ)=Ryx(τ)

能量信号x(t)的自相关函数:

Rx(τ)=x(t)x(t+τ)dt

特别的,对于实信号的自相关函数:

Rx(τ)=x(t)x(t+τ)dt

自相关函数的共轭偶对称性: Rx(τ)=Rx(τ)

实信号的自相关函数是偶函数:

Rx(τ)=Ry(τ)

自相关函数和能量的联系:x(t)的能量是自相关函数在τ=0处的值 Ex=Rx(0)=x(t)x(t+0)dt=|x(t)|2dt

参考链接:总结一下通信原理的前置知识 - 萍水间人 - 博客园

6.2.4 卷积

卷积的本质是两个序列/函数的平移,加权叠加。

对于函数x(t)h(t),卷积的结果是:

y(t)=x(t)h(t)=x(τ)h(tτ)dτ=x(tτ)h(τ)dτ

冲激函数δ(t)的性质和卷积特性:

(1) 抽样性/筛选性

f(t)δ(t)=f(0)δ(t)f(t)δ(t)dt=f(0)

对于位移情况:

f(tt0)δ(t)=f(t0)δ(t)f(t)δ(tt0)dt=f(t0)

(2) 奇偶性

δ(t)=δ(t)

(3) 尺度变换

δ(at)=1|a|δ(t)

(4) 卷积性

f(t)=f(t)δ(t)=x(τ)δ(tτ)dτ

6.3 噪声的白化

噪声白化是指对噪声数据进行去相关,且噪声协方差被单位化的过程。若am×1维随机向量序列(均值=0),则其协方差矩阵可表示为一个m×m维的矩阵Ca,如果该协方差矩阵Ca非奇异且不为单位矩阵,则称随机向量a为有色(或非白)随机向量。

令协方差矩阵特征值分解为:

Ca=VDVT

记:

W=VD12VT=Ca1/2

此时,令变换:

b=Wa=Ca1/2a

b的协方差矩阵为单位矩阵I,即随机向量b是标准白色随机向量,换言之,有色的随机向量a经过线性变换后变成了白色随机向量。一般将线性变换矩阵W称为随机向量a白化矩阵

通过研究发现,对于某一随机变量,能使其进行白化的变换矩阵并不是唯一存在的例如上述分析的W矩阵和通常MNF变换(最小噪声分离变换)中使用的白化矩阵FT都可以达到使a白化的效果。进一步的研究显示,当采用不同的白化矩阵所得的白化结果b并不一样。

虽然变换矩阵WFT都可以使随机变量a“白化”,但白化矩阵W的变换结果并不改变变量a原有的分布特征,而白化矩阵FT则不论变量a原有的分布特征如何,变化后均呈高斯分布

张颢老师说过:在很多情况下,噪声是不是白的不本质,因为可以通过白化矩阵转换为“白的”。

参考资料:基于噪声白化的高光谱数据子空间维数算法 - 万方
参考资料:数据白化 - CSDN
参考资料:白噪声和有色噪声 - CSDN
参考资料:随机信号处理笔记之色噪声及白化滤波器 - CSDN

6.4 分贝(dB)

6.4.1 分贝的基本定义

分贝 dB 定义为两个数值的对数比率,这两个数值分别是测量值和参考值(也称为基准值),存在两种定义情况。

  • 一种为功率之比:

1dB=10log10(PP0)

  • 一种为幅值之比:

1dB=10log10(UU0)2=20log10(UU0)

其中,P0U0为功率和幅值的参考值。

使用功率之比公式进行计算的例子如:声功率(W),声强(W/m2),电功率,电强等。

使用幅值之比公式进行例子如:声压(Pa),电压(V),加速度(m/s2),温度等。

分贝值完全依赖于测量值与参考值之比,因此计算时选择合适的参考值很关键。 没有特殊要求时,参考值通常为1

通常,参考功率被定义为标准参考值,如1毫瓦(mW)或1瓦(W),具体取决于特定的应用或标准。

6.4.2 分贝的性质

贝尔最初是用来表示电信功率讯号的增益和衰减的单位,1个贝尔的增益是以功率在放大后与放大前的比值。所以,电压增益的分贝表达式是从功率的角度来考虑的,即分贝应该理解为功率的增大或衰减情况

  • 当用对数 dB 表达增益随频率变化的曲线时,可大大扩大线性增益变化的区间。例如:人耳可听的声压幅值波动范围为2×105Pa20Pa,而用幅值 dB 表示时对应的 dB 数值仅仅为0120 dB
  • 计算多级放大的总增益时,可将乘法化为加法进行运算。
  • dB 值可正可负。正值表示增大,负值表示衰减。若XX0<1,则 dB 值为负值。也就是说测量值大于参考值的为正,小于参考值的为负。
  • 幅值比互为倒数时, dB 值互为正负。这是因为:

20log10(XX0)=20log10(1X0/X)=20log10(X0X)

  • dB 值与线性幅值比的关系如下表所示

红色字体表示的是几个比较重要的 dB 值,我们应该要记住,因为我们经常要用到它们。像增大 +6 dB 表示线性幅值增大一倍。

6.4.3 特别说明3 dB 0 dB

通过上表易知3 dB 对应的幅值比为0.707,即22倍,也就是说幅值是原来的22倍。若按功率比来计算,则功率比为12,也就是原功率的一半,故3 dB 称为半功率点”或者“截止频率点。这时功率是正常时的一半,电压或电流是正常时的0.707。在电声系统中,±3 dB 的差别被认为不会影响总特性。所以各种设备指标,如频率范围,输出电平等,不加说明的话都可能有±3 dB的出入。

0 dB 表示输出与输入或两个比较信号一样大。分贝是一个相对大小的量,没有绝对的量值。

6.4.4 dBdBmdBc之间的区别

(1) dBm

dBm 是一个考征功率绝对值的值,计算公式为:

10log10P1 mW

其中,P代表信号的功率。

[例1] 如果发射功率P1 mw,折算为 dBm 后为 0 dBm

[例2] 40 W的功率,dBm 折算值:10log1040 W1 mw=10log10(40000)=46 dBm

(2) dBi和dBd

dBidBd 是考征增益的值(功率增益),两者都是一个相对值, 但参考基准不一样。dBi 的参考基准为全方向性天线,dBd 的参考基准为偶极子,故两者略有不同。一般认为表示同一增益,用 dBi 表示比用  dBd 表示要大 2.15

[例3] 0 dBd=2.15 dBi

[例4] 一面增益为16 dBd 的天线,其增益折算成单位为 dBi 时,为 18.15 dBi (一般忽略小数位,为 18 dBi)。

(3) dB

dB 表示相对值。在计算信号A的功率PA大于或小于信号B的功率PB多少 dB 时,可按公式 10log10PAPB 计算。

[例5] 甲功率比乙功率大一倍,则10log10PP=10log102=3 dB。也就是说甲的功率比乙的功率大3 dB

[例6] 如果信号A的功率为46 dBm,信号B的功率为40 dBm,则可以说AB6 dB

[例7] 如果A天线为12 dBdB天线为14 dBd,则可以说A比B小2 dB

(4) dBc

有时也会看到 dBc,它也是一个表示功率相对值的单位,与 dB 的计算方法完全一样。一般来说,dBc 是相对于载波 (Carrier) 功率而言,在许多情况下,用来度量与载波功率的相对值,如用来度量干扰(同频干扰、互调干扰、交调干扰、带外干扰等)以及耦合、杂散等的相对量值。在采用 dBc 的地方,原则上也可以使用 dB 替代。

6.4.5 分贝的基本计算

dB 的意义其实再简单不过了,就是把一个很大(后面跟一长串0的)或者很小(前面有一长串0的)的数比较简短地表示出来。如(此处以功率为例):

P=100000=105P(dB)=10log10(P)dB=50dB

P=0.00000001=108P(dB)=10log10(P)dB=80dB

dB 的引入是为了将乘除关系变为加减关系,更便于工程运算。因此一般来讲,在工程中 dB 之间只有加减,没有乘除。

一般来讲,在工程中,dBdB 之间只有加减,没有乘除,而用得最多的是减法。

dBmdBm 是两个功率相除,信号功率和噪声功率相除就是信噪比(SNR)。比如:

30dBm0dBm=1000mW1mW=1000=30dB

dBmdBm 实际上是两个功率相乘,没有实际的物理意义。

那么 dB 可以任意相加吗?怎么相加?如70 dB +60 dB 等于130 dB 吗?在信号处理中,如果要将两个信号的分贝相加,可以使用以下公式进行计算(以功率计算公式为例):

Ltotal=10log10(10L1/10+10L2/10)

对于上面提到的例子,将70 dB +60 dB ,可以进行如下计算:

Ltotal=10log10(1070/10+1060/10)=10log10(107+106)=10log10(11000000)107.04170.41 dB

可以看到得到的结果为70.41 dB记住不是130 dB

参考链接:什么是分贝dB? - linmue-谭祥军的文章 - 知乎
参考链接:好问题:-3dB、0.707、截止频率,三者啥关系?- 芯语 - 面包板
参考链接:dB、dBm、dBc的解释说明
参考链接: 【Get深一度】信号处理(三)——3db带宽 - CSDN
参考链接: 带宽、特征频率、截止频率、-3dB什么意思 - CSDN
参考链接:分贝(dB)的概念辨析- CSDN
参考链接:增益比值 dB 以及 dBw-dBmv 等之详解 - 乐鑫科技

6.5 自由度(Degrees of Freedom, DoF)

6.5.1 统计中的自由度

在传统的统计学中,自由度原本的意思是一个随机向量中能够发生变化的分量的维度数量,例如:如果一个向量xRn中有p个分量可以自由发生变化,那这个向量x的自由度为p。下面结合一个简单的例子理解。

考虑以下情况中进行线性回归拟合模型:yRn,XRn×pX是列满秩的,则利用拟合模型所得的预测结果y^=Xβ^即为yXp维列空间上的正交投影,而其残差r=yy^即为yXp维列空间的正交补上的投影,维度为np。则我们可以说这个线性模型的自由度(DoF)或模型自由度为p、而其残差自由度为np

对于残差自由度而言,顾名思义,如果用σ2来表示误差的方差的话,那残差r实际上在p个方向上的投影均为0、而在剩余的np个方向上自由的变化。

6.5.2 矩阵自由度

(一) 自由度概念再解释

下面是两个比较好理解的自由度定义:

  • 自由度是n个变量在某个(些)约束下,能够自由变化的最多变量个数m为该约束下的自由度;
  • 自由度是用约束式求解矩阵所需要的最少个数。

维基百科的解释:数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。举例来说,从电脑屏幕到厨房的位移能够用三维向量ai+bj+ck来描述,因此这个位移向量的自由度是3。自由度也通常与这些向量的坐标平方和,以及卡方分布中的参数有所关联。

再来看两个例子:

若存在2个变量ab,而a+b=6,那么他的自由度为1。因为其实只有a才能真正的自由变化,b会被a选值的不同所限制。在这个例子中a+b=6就是约束,可以自由变化的变量最多个数为1。所以自由度为1;

对于一个二维旋转矩阵, Mrot2d=(cosθsinθsinθσYcosθ),虽然这个2×2的矩阵有四个变量,但是一旦其中的一个值确定了,其他三个值就确定了。比如说当知道(0,0)位置下的 cosθ=1,那么则有sinθ=0,不会等于其他数字。所以在二维旋转矩阵这个约束下,可以自由变化的最多变量个数为1,矩阵自由度为1。用几何的方式来思考也很好理解,在一个二维平面下的旋转,只有一个变量就是旋转角度θ值。

(二) 矩阵自由度

可以依据上文对自由度的解释应用到矩阵中。比如一个3×3的矩阵,具有9个元素,那么它的自由度最高就是9。但是9个元素可能由几个变量通过一定方式组合而成,比如旋转矩阵,只有α,β,γ三个旋转变量,通过三角函数组成了旋转矩阵,自由度只有3而不是9。

以下是一个Stack Overflow上的回答,以下是翻译,也可以增加对矩阵自由度的理解:

有几种方式来思考矩阵的自由度:

  • 考虑一个m×n的矩阵。这个矩阵有mn个元素/变量。在没有任何约束条件下,我们可以任意改变mn个数值来构造出mn个互相不同的矩阵,所以它有mn个自由度。

  • 一个上三角矩阵,维度是m×m,我们知道在这个矩阵里很多值都是0,实际上只有m+(m1)++2+1个非0元素/变量,所以这个值就是上三角矩阵的自由度。

  • 一个2×2的旋转矩阵,自由度等于多少?这对矩阵中可能的值施加了巨大的限制。确实,一旦其中一个值确定了之后,其他的所有值都被确定了。这个旋转矩阵只有一个自由度。

  • 如果我们“equivalence classes”即“等价类”呢?如果我们知道任意矩阵的所有缩放都是相等的呢?我们还剩多少个自由度?对于任意矩阵,当位置(1,1)上的元素非0,我们就可以对矩阵的所有元素除以这个元素,这时(1,1)上的元素就等于1。现在考虑有两个矩阵AB=2A,当我们缩放这两个矩阵使得它们的第一个元素为1,我们会发现这两个矩阵是等价的。因此,我们消除了一个自由度。这就是单应(矩阵)的例子。所以,对于一个3×3的单应矩阵,只有8个自由度。这些自由度也可以用几何的方式来解释。

n阶方阵的秩等于r,也就是等价于它的列/行秩等于r,因此,为了构造一个秩为r的方阵,可以先选r个线性无关的n维向量作为它的列/行向量,这就有n×r的自由度,另外剩下的nr个列/行向量必须能用已选定的r个列/行向量线性表出,也就是它们要分别能写成已选定的r个列/行向量的线性组合,每一个线性组合有r个系数,也就是有r个自由度,nr个向量就有(nr)×r个自由度,这样这个矩阵就能被确定下来了,所以一共的自由度是:

n×r+(nr)×r=(2nr)×r

而且这个结论可以推广到非方阵的情形.

6.5.3 方程自由度

自由度是指变量比方程多的情况。如果有10个变量和7个方程就有3个自由度。也就是说,其中3个变量可以假设你想要的任何值,对于这3个变量的任何给定值,剩下的7个变量都有一个特定的解。

也就是说,方程的数量+自由度总是会给出你有多少变量。

如果方程的数量大于变量的数量你就没有任何自由度方程组通常是完全不可解的。

如果你有自由度,你通常需要找到一些额外的约束来添加额外的方程。它的思想是让方程和变量的数量完全相同在这种情况下只有一个解。这是在方程是线性无关的假设下。在计算自由度之前,你必须先去掉所有线性相关的方程。

例如,2x+3y=54x+6y=10是两个方程,但它们不是线性独立的,所以当你去掉一个,你看到只有一个方程有两个变量,所以你有一个方程和一个自由度。

参考链接1:漫谈统计学习-自由度(DoF) - Chunxi Huang的文章 - 知乎
参考链接2:关于矩阵的自由度DOF的理解 - LYF0816LYF的文章 - CSDN
参考链接3:矩阵、方程自由度的理解 - 迪迦谁占了的文章 - CSDN

6.6 信号子带划分

子带技术的基本思想是利用分析滤波器组,将待处理的全带信号划分为子带信号,从而将相应的信号处理转移至子带域,最后再利用综合滤波器组将处理后的子带信号进行重构得到输出信号。将输入信号划分为多个子带信号,这种结构可以更有效地对信号进行处理,并且能够降低复杂度以及减少自适应滤波器的阶数。

6.7 信号去相关

雷达到目标的不同散射体之间的相对路径长度就会发生变化,导致每个脉冲的回波相位发生变化,合成回波的幅度也发生波动,这就是去相关现象。对于刚体目标,RCS的去相关现象主要是由距离和视角变化引起的。而对于非刚体目标,比如地面灌木丛、草地、树木、海面、海浪等,除了与距离和视角变化有关外,还与目标本身的特性有关,如目标内部发生运动等。

相干雷达高度表与目标之间存在相对运动或者目标为非刚体目标,则会出现去相关现象,也就是信号相位并非一致,这样使得回波幅度不能相干积累。

6.8 Capon谱/最小方差谱估计(MVDR算法)

最小方差谱估计方法(MVDR)也称作Capon方法,其基本思想是设计与输入数据相关的带通滤波器组的过程。Capon方法应用一个带通滤波器来计算一个估计的谱值。为了得到统计稳定的谱估计值,需要将原始样本分成子序列进行处理,并将每一个子序列所获得的结果取平均值。

Capon算法又被称为最小方差无偏估计算法(MVDR),是一种空间谱估计算法,通过对接收到的信号进行处理,实现信号源的空间定位。它是基于波束成型技术发展而来,具有很高的方向性和性能可靠性,广泛应用于雷达、通信、声学等领域中。

对一个长度为m的有限长脉冲响应滤波器h=[h0,h1,h2,,hm]T,当输入原始数据序列{x(t)}时,滤波器在t时刻的输出为:

y(t)=hHx=k=0mhkx(tk)=hH(x(t)x(t1)x(tm))

则滤波器输出的功率表示为:

E{|y(t)|2}=E{hHxxHh}=hHE{xxH}h=hHR h

式中R表示数据矢量的协方差矩阵。

滤波器h对频率为ω的正弦分量的响应为:

H(ω)=hHa(ω)=k=0mhkejωk

式中a(ω)=[1,ejω,,ejmω]T

如果想使滤波器对于当前值ω周围的频带具有良好的选择性,则可以考虑最小化滤波器输出噪声均方值,其约束条件为滤波器使频率ω无失真地通过,即:

{minhhHR h s.t. hHa(ω)=1

由拉格朗日乘子法可以解得滤波器响应为:

h=R1a(ω)aH(ω)R1a(ω)

代入可求得滤波器的输出功率为:

E{|y(t)|2}=1aH(ω)R1a(ω)

因此信号在通带的中心频率处的功率谱密度估计式为:

P(ω)E{|y(t)|2}β=1βaH(ω)R1a(ω)

式中β为带通滤波器的频率带宽。由于带通滤波器的设计是依赖于数据的,所以β未必是与数据独立的,也未必是与频率独立的,因此并不能简单地被当作一个缩放比例。

最简单的一种可能性是β=1m+1,这是由时间带宽积决定的。而关于β的一个更加精确的表达式可以如下获得:一人带通滤波器的(等效)带宽可以被定义为中心为W的矩形脉宽,在滤波器的频率响应中,其集中了信号的全部能量。根据此定义,可以假定β满足:

ππ|H(ψ)|2 dψ=|H(ω)|22πβ

在当前情况下,H(w)=1,因此可以得到:

β=12πππ|hHa(ψ)|2 dψ=hH[12πππa(ψ)aH(ψ) dψ]h

上式中二次型中矩阵的第(k,p)个元素由下式给出:

12πππejψ(kp) dψ=δk,p

则有:

β=hHh=aH(ω)R2a(ω)[aH(ω)R1a(ω)]2

这里β的表达式是基于这样的假设,即曲线|H(ψ)|2=|hHa(ψ)|2,ψ[π,π]下的绝大多数区域都位于中心频率ω的周围。

在上面的推导中,假定可以获得真实的数据协方差矩阵R。为了在实际中应用,必须用样本估计值代替公式中的R。例如应用:

R^=1Nmt=M+1N[y(t)y(tm)][y(t)y(tm)]

则根据不同的β,得到下列两种Capon谱估计器,分别为:

ϕ^(ω)=m+1aH(ω)R^1a(ω)ϕ^(ω)=aH(ω)R^1a(ω)aH(ω)R^2a(ω)

为了使R^1存在,要求m<N2,其确定了Capon方法所能达到的分辨率极限。当m减小时,Capon方法的分辨率将会变差,但是方的估计精确性会得以提高。

转载自:最小方差谱估计 - 中国大百科全书

参考链接1:关于Capon最优加权系数和MVDR加权系数等价的证明 - CSDN
参考链接2:Capon波束形成器推导和仿真 - CSDN
参考链接3:第五章功率谱估计第5节 - 百度文库
参考链接4:阵列信号的(空间谱)DOA估计概述 - 芯语 - 面包板
参考链接5:阵列信号DOA估计系列(一).概述 - CSDN

posted @   博客侦探  阅读(549)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示