LA@二次型规范形
规范形
-
如果二次型 f ( x 1 , x 2 , ⋯ , x n ) = x T A x f(x_1,x_2,\cdots,x_n)=\bold{x^{T}Ax} f(x1,x2,⋯,xn)=xTAx的标准形 f = ∑ i = 1 n k i y i 2 f=\sum_{i=1}^{n}k_iy_i^2 f=∑i=1nkiyi2的系数 k i ∈ G = { − 1 , 0 , 1 } k_i\in G=\{-1,0,1\} ki∈G={−1,0,1},则 f f f可以表示为 f f f= ∑ i = 1 p y i 2 − ∑ j = 1 r − p y p + j 2 \sum_{i=1}^py_i^2-\sum_{j=1}^{r-p}y_{p+j}^2 ∑i=1pyi2−∑j=1r−pyp+j2,则这个形式称为二次型 f f f的规范形
-
另一种描述:如果 f ( x 1 , x 2 , ⋯ , x n ) = x T A x f(x_1,x_2,\cdots,x_n)=\bold{x^{T}Ax} f(x1,x2,⋯,xn)=xTAx可以通过线性变换 x = C y \bold{x=Cy} x=Cy化为: N = ∑ i = 1 p y i 2 − ∑ j = p + 1 r y j 2 N=\sum_{i=1}^py_i^2-\sum_{j=p+1}^{r}y_j^2 N=∑i=1pyi2−∑j=p+1ryj2,
- r = r ( A ) = r ( f ) r=r(A)=r(f) r=r(A)=r(f)即二次型 f f f的秩
-
使用矩阵乘法表示规范形二次型
-
f ( y 1 , ⋯ , y n ) = ∑ i = 1 p y i 2 − ∑ j = 1 q y p + j 2 = ( y 1 , y 2 , ⋯ , y n ) ( 1 ⋱ 1 − 1 ⋱ − 1 0 ⋱ 0 ) ( y 1 y 2 ⋮ y n ) = y T ( Λ G ) y \begin{aligned} f(y_1,\cdots,y_n) &=\sum_{i=1}^py_i^2-\sum_{j=1}^{q}y_{p+j}^2\\ &=(y_1,y_2,\cdots,y_n) \begin{pmatrix} 1&&&&&&&& \\ &\ddots&&&&&& &\\ &&1&&&&&&& \\ &&&-1&&&&&\\ &&&&&\ddots&&&\\ &&&&&&-1&&\\ &&&&&&&0&\\ &&&&&&&&\ddots\\ &&&&&&&&&0\\ \end{pmatrix} \begin{pmatrix} y_{1}\\ y_{2}\\ \vdots\\ y_{n} \\ \end{pmatrix} \\&=\bold{{y}^{T}(\Lambda_{G}){y}} \end{aligned} f(y1,⋯,yn)=i=1∑pyi2−j=1∑qyp+j2=(y1,y2,⋯,yn) 1⋱1−1⋱−10⋱0 y1y2⋮yn =yT(ΛG)y
-
Λ G \bold{\Lambda_G} ΛG表示规范形对角阵矩阵 ( 1 1 , ⋯ , 1 p , − 1 p + 1 , ⋯ , − 1 r , 0 , ⋯ , 0 ) (1_{1},\cdots,1_{p},-1_{p+1},\cdots,-1_{r},0,\cdots,0) (11,⋯,1p,−1p+1,⋯,−1r,0,⋯,0)
-
规范形的矩阵
-
Λ G = ( E p − E q O n − r ) p + q = r ⩽ n \Lambda_{G} =\begin{pmatrix} E_{p}&&\\ &-E_{q}&\\ &&O_{n-r} \end{pmatrix} \\p+q=r\leqslant{n} ΛG= Ep−EqOn−r p+q=r⩽n
-
其中 r = R ( f ) r=R(f) r=R(f),表示二次型的秩
二次型标准形间的关系
- 同一个二次型的标准形不唯一,但是它们具有相同的正负平方项个数
惯性指数
- 二次型的规范形
f
=
∑
i
=
1
p
y
i
2
−
∑
j
=
1
q
y
p
+
j
2
f=\sum_{i=1}^py_i^2-\sum_{j=1}^{q}y_{p+j}^2
f=∑i=1pyi2−∑j=1qyp+j2(
p
+
q
=
r
p+q=r
p+q=r)中,
-
p p p称为正惯性指数
-
q = r − p q=r-p q=r−p称为负惯性指数
-
p − q = p − ( r − p ) = 2 p − r p-q=p-(r-p)=2p-r p−q=p−(r−p)=2p−r称为符号差
-
- 正负惯性指数统称惯性指数
推论:惯性指数和特征值个数
- 正(负)惯性指数是二次型矩阵 A \bold{A} A的正(负)特征值个数
- 借助符号描述:
- 设 p , q p,q p,q分别是二次型 f = x T A x f=\bold{x^{T}Ax} f=xTAx的标准形的正惯性指数和负惯性指数
- 则 A \bold{A} A的特征值 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn中有 p p p个为正数, q q q个为负数
标准形可以转换为规范形定理👺惯性定理
-
定理:对于任意 n n n元二次型 f ( x 1 , ⋯ , x n ) = x T A x f(x_1,\cdots,x_n)=\bold{x^{T}Ax} f(x1,⋯,xn)=xTAx, ( A T = A ) (\bold{A^{T}=A}) (AT=A),一定存在一个正交(可逆)线性变换 x = C z \bold{x=Cz} x=Cz,使得 f f f可以化为规范形 g ( z ) = f ( C z ) g(\bold{z})=f(\bold{Cz}) g(z)=f(Cz)
-
本定理作为二次型可规范化推论:二次型总是可以规范化
-
证明:
- 由二次型可标准化定理可知,存在线性变换 x = P y \bold{x=Py} x=Py使得 f ( x ) f(\bold{x}) f(x)= f ( P y ) f(\bold{Py}) f(Py)= y T Λ y \bold{y^{T}\Lambda{y}} yTΛy= ∑ i = 1 n k i y i 2 \sum_{i=1}^{n}k_iy_i^2 ∑i=1nkiyi2
- 设 R ( f ) = r R(f)=r R(f)=r,则 Λ \bold\Lambda Λ= diag ( λ 1 , ⋯ , λ n ) \text{diag}(\lambda_1,\cdots,\lambda_n) diag(λ1,⋯,λn)的特征值 λ i , i = 1 , ⋯ , n \lambda_i,i=1,\cdots,n λi,i=1,⋯,n中恰好有 r r r个不为0,其余 n − r n-r n−r个为0,不妨设 λ 1 , ⋯ , λ r = 0 \lambda_1,\cdots,\lambda_r=0 λ1,⋯,λr=0, λ r + 1 , ⋯ , λ n ≠ 0 \lambda_{r+1},\cdots,\lambda_{n}\neq{0} λr+1,⋯,λn=0,从而 Λ \bold{\Lambda} Λ= diag ( λ 1 , ⋯ , λ r , 0 , ⋯ , 0 ) \text{diag}(\lambda_1,\cdots,\lambda_r,0,\cdots,0) diag(λ1,⋯,λr,0,⋯,0)
- 不妨令矩阵
K
\bold{K}
K=
diag
(
k
1
,
⋯
,
k
n
)
\text{diag}(k_1,\cdots,k_n)
diag(k1,⋯,kn),其中
k
i
k_i
ki=
{
1
∣
λ
i
∣
i
⩽
r
1
i
>
r
\begin{cases}\frac{1}{\sqrt{|\lambda_i|}}&i\leqslant{r}\\1&i>r\end{cases}
{∣λi∣11i⩽ri>r,即构造可逆对角阵
K
\bold{K}
K=
diag
(
1
∣
λ
1
∣
,
⋯
,
1
∣
λ
r
∣
,
1
,
⋯
,
1
)
\text{diag}(\frac{1}{\sqrt{|\lambda_1|}},\cdots,\frac{1}{\sqrt{|\lambda_r|}},1,\cdots,1)
diag(∣λ1∣1,⋯,∣λr∣1,1,⋯,1)
- 显然
∣
K
∣
≠
0
\bold{|K|}\neq{0}
∣K∣=0,从而
K
\bold{K}
K可逆,构造线性变换
y
=
K
z
\bold{y=Kz}
y=Kz,则
x
=
P
y
=
P
(
K
z
)
\bold{x=Py=P(Kz)}
x=Py=P(Kz)
- 线性变换
y
=
K
z
\bold{y=Kz}
y=Kz,即
- y 1 = 1 ∣ λ 1 ∣ z 1 y_1=\frac{1}{\sqrt{|\lambda_1|}}z_1 y1=∣λ1∣1z1
- ⋮ \vdots ⋮
- y r = 1 ∣ λ r ∣ z r y_r=\frac{1}{\sqrt{|\lambda_r|}}z_r yr=∣λr∣1zr
- y r + 1 = z r + 1 y_{r+1}=z_{r+1} yr+1=zr+1
- ⋮ \vdots ⋮
- y n = z n y_{n}=z_{n} yn=zn
- 线性变换
y
=
K
z
\bold{y=Kz}
y=Kz,即
- 从而 f ( x ) f(\bold{x}) f(x)= f ( P K z ) f(\bold{PKz}) f(PKz)= z T K T P T A P K z \bold{z^{T}K^{T}P^{T}APKz} zTKTPTAPKz= z T K T ( P T A P ) K z \bold{z^{T}K^{T}(P^{T}AP)Kz} zTKT(PTAP)Kz= z T K T Λ K z \bold{z^{T}K^{T}\Lambda{K}z} zTKTΛKz
- 而
C
=
K
T
Λ
K
\bold{C}=\bold{K^{T}\Lambda{K}}
C=KTΛK=
diag
(
λ
1
∣
λ
1
∣
,
⋯
,
λ
r
∣
λ
r
∣
,
0
,
⋯
,
0
)
\text{diag}(\frac{\lambda_1}{|\lambda_1|},\cdots,\frac{\lambda_r}{|\lambda_r|},0,\cdots,0)
diag(∣λ1∣λ1,⋯,∣λr∣λr,0,⋯,0)
- 注意对角阵连乘计算公式: c j = ∏ i = 1 n d i j c_j=\prod_{i=1}^{n}d_{ij} cj=∏i=1ndij, j = 1 , ⋯ , n j=1,\cdots,n j=1,⋯,n, d i j d_{ij} dij表示第 i i i个对角阵的第 j j j个对角元素
- c j = λ i ∣ λ i ∣ ∈ { − 1 , 1 } c_{j}=\frac{\lambda_i}{|\lambda_{i}|}\in\{-1,1\} cj=∣λi∣λi∈{−1,1}, i = 1 , ⋯ , r i=1,\cdots,r i=1,⋯,r
- f ( x ) f(\bold{x}) f(x)= z T C z \bold{z^{T}Cz} zTCz是一个规范形
- 显然
∣
K
∣
≠
0
\bold{|K|}\neq{0}
∣K∣=0,从而
K
\bold{K}
K可逆,构造线性变换
y
=
K
z
\bold{y=Kz}
y=Kz,则
x
=
P
y
=
P
(
K
z
)
\bold{x=Py=P(Kz)}
x=Py=P(Kz)
- 记 C = P K \bold{C=PK} C=PK,即有可逆变换 x = C z \bold{x=Cz} x=Cz能使 f f f化为规范形 f ( x ) f(\bold{x}) f(x)= f ( C z ) f(\bold{Cz}) f(Cz)= ∑ i = 1 n λ i ∣ λ i ∣ z i 2 \sum_{i=1}^{n}\frac{\lambda_i}{|\lambda_i|}z_i^{2} ∑i=1n∣λi∣λizi2
-
附:为什么要这么构造 K \bold{K} K?
-
∣
k
i
y
i
2
∣
|k_iy_i^2|
∣kiyi2∣=
z
i
2
z_i^2
zi2
(1)
,解得 y i 2 = z i 2 ∣ k i ∣ y_i^2={\frac{z_i^2}{|k_i|}} yi2=∣ki∣zi2,即 y i = ± z i 2 ∣ k i ∣ y_i=\pm{\sqrt{\frac{z_i^2}{|k_i|}}} yi=±∣ki∣zi2= ± ∣ z i ∣ ∣ k i ∣ \pm\frac{|z_i|}{\sqrt{|k_i|}} ±∣ki∣∣zi∣ - 这说明
a
=
∣
z
i
∣
∣
k
i
∣
a=\frac{|z_i|}{\sqrt{|k_i|}}
a=∣ki∣∣zi∣,
b
=
−
∣
z
i
∣
∣
k
i
∣
b=-\frac{|z_i|}{\sqrt{|k_i|}}
b=−∣ki∣∣zi∣都满足
(1)
,而 c = z i ∣ k i c=\frac{z_i}{\sqrt{|k_i}} c=∣kizi的取值是 a , b a,b a,b中的一个,因此 c c c满足(1)
- 虽然
a
,
b
,
c
a,b,c
a,b,c都满足
(1)
,甚至可以在 i i i取不同值时混用也可以,即 K \bold{K} K不是唯一的 - 但是统一方便起见,我们采用 y i = z i ∣ k i ∣ y_i=\frac{z_i}{\sqrt{|k_i|}} yi=∣ki∣zi, i = 1 , ⋯ , r i=1,\cdots,r i=1,⋯,r作为规范化线性变换,而 y r + 1 , ⋯ , y n y_{r+1},\cdots,y_{n} yr+1,⋯,yn这部分变换可以随意(但是要保持变换的可逆性),为简单起见,通常取 y j = z j , j = r + 1 , ⋯ , n y_j=z_j,j=r+1,\cdots,n yj=zj,j=r+1,⋯,n
-
∣
k
i
y
i
2
∣
|k_iy_i^2|
∣kiyi2∣=
z
i
2
z_i^2
zi2
实对称阵间相互合同的充要条件
- 实对称阵 A , B A,B A,B合同的充要条件它们有相同的秩 r ( A ) = r ( B ) r(A)=r(B) r(A)=r(B)和正惯性指数 p p p
二次型规范化步骤
- 先将二次型标准化为
f
=
g
(
y
)
=
∑
i
=
1
n
k
i
y
i
2
f=g(\bold{y})=\sum_{i=1}^{n}k_iy_i^2
f=g(y)=∑i=1nkiyi2=
y
T
Λ
y
\bold{y^{T}\Lambda{y}}
yTΛy,
- 若二次型的秩 r = R ( f ) r=R(f) r=R(f),则 Λ \bold{\Lambda} Λ的对角元素包含 n − r n-r n−r个0, f = ∑ i = 1 n k i y i 2 f=\sum_{i=1}^{n}k_iy_i^2 f=∑i=1nkiyi2= ∑ i = 1 r k i y i 2 + ∑ i = r + 1 n 0 \sum_{i=1}^{r}k_iy_i^2+\sum_{i=r+1}^{n}0 ∑i=1rkiyi2+∑i=r+1n0= ∑ i = 1 r k i y i 2 \sum_{i=1}^{r}k_iy_i^2 ∑i=1rkiyi2
- 设 Λ = diag ( λ 1 , ⋯ , λ n ) \bold{\Lambda}=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn)= diag ( λ 1 , ⋯ , λ r , 0 , ⋯ , 0 ) \text{diag}(\lambda_1,\cdots,\lambda_r,0,\cdots,0) diag(λ1,⋯,λr,0,⋯,0),
- 由惯性定理,规范化后的二次型的矩阵为 Λ G \bold{\Lambda_{G}} ΛG= diag ( λ 1 ∣ λ 1 ∣ , ⋯ , λ r ∣ λ r ∣ , 0 , ⋯ , 0 ) \text{diag}(\frac{\lambda_1}{|\lambda_1|},\cdots,\frac{\lambda_r}{|\lambda_r|},0,\cdots,0) diag(∣λ1∣λ1,⋯,∣λr∣λr,0,⋯,0)
- y = ( Λ G ) z \bold{y=(\Lambda_{G})z} y=(ΛG)z能使 f = y T Λ y f=\bold{y^{T}\Lambda{y}} f=yTΛy规范化为 f = z T ( Λ G ) z f=\bold{z^{T}(\Lambda_{G})z} f=zT(ΛG)z
小结
- 从上述规范化步骤可以看出,若已求得而次形的标准形,只需要抽取各个系数的符号代替标准形的原系数,即得到规范形
- 但是如果需要给出规范化所用的线性变换(矩阵),则要用公式 diag ( 1 ∣ λ 1 ∣ , ⋯ , 1 ∣ λ r ∣ , 1 , ⋯ , 1 ) \text{diag}(\frac{1}{\sqrt{|\lambda_1|}},\cdots,\frac{1}{\sqrt{|\lambda_r|}},1,\cdots,1) diag(∣λ1∣1,⋯,∣λr∣1,1,⋯,1)计算
例
- 化二次型 f = x 1 x 2 + x 1 x 3 + 2 x 2 x 3 f=x_1x_2+x_1x_3+2x_2x_3 f=x1x2+x1x3+2x2x3为规范形
- 解:
- 将
f
f
f标准化,可得
f
=
z
1
2
−
z
2
2
−
2
z
3
2
f=z_1^2-z_2^2-2z_3^2
f=z12−z22−2z32(过程在此处不是重点,略去)
- 其矩阵为 Λ = diag ( 1 , − 1 , − 2 ) \bold{\Lambda}=\text{diag}(1,-1,-2) Λ=diag(1,−1,−2)
- 规范化后的矩阵 Λ G \bold{\Lambda_{G}} ΛG= diag ( 1 , − 1 , − 1 ) \text{diag}(1,-1,-1) diag(1,−1,−1)
- 用到的可逆线性变换 z = K w \bold{z=Kw} z=Kw,其中 K = diag ( 1 , − 1 , − 1 2 ) \bold{K}=\text{diag}(1,-1,-\frac{1}{\sqrt{2}}) K=diag(1,−1,−21)(或 K = diag ( 1 , 1 , 1 2 ) \bold{K}=\text{diag}(1,1,\frac{1}{\sqrt{2}}) K=diag(1,1,21))
- f = w 1 2 − w 2 2 − w 3 2 f=w_1^2-w_2^2-w_3^2 f=w12−w22−w32
- 将
f
f
f标准化,可得
f
=
z
1
2
−
z
2
2
−
2
z
3
2
f=z_1^2-z_2^2-2z_3^2
f=z12−z22−2z32(过程在此处不是重点,略去)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了