矩阵单位与初等矩阵笔记
矩阵单位 Es,t
在一个方阵中,第 s 行与第 t 列的交叉位置的元素为 1,且所有其它位置的元素均为 0,这个矩阵叫做矩阵单位,并记为 Es,t. 显然,n 阶单位矩阵 E 满足:
E = E1,1 + E2,2 + ... + En,n
Es,tA
A 是 m×n 矩阵,Es,t 是 m×m 矩阵,则 Es,tA =
0 0 ... 0 ... 0 ... 0 a11 a12 ... a1t ... a1n
... ... ... ...
(s) 0 0 ... 0 ... 1 ... 0 · as1 as2 ... ast ... asn
... ... ... ...
(m) 0 0 ... 0 ... 0 ... 0 am1 am2 ... amt ... amn
(t) (m)
=
0 0 ... 0 ... 0
... ...
(s) at1 at2 ... att ... atn
... ...
(m) 0 0 ... 0 ... 0
(t)
由上可知,A 左乘 Es,t 的结果在效果上就相当于把 A 的第 t 行放到第 s 行,然后对其余行都作置 0 处理.
当 s = t 时,Es,sA 的结果相当于 A 中第 s 行保持不变,而把其余行都作置 0 处理. 易知
EA = E1,1A + E2,2A + ... + Em,mA = A
AEs,t
再看右乘的情形,A 是 m×n 矩阵,Es,t 是 n×n 矩阵,则 AEs,t =
a11 a12 ... a1t ... a1n 0 0 ... 0 ... 0 ... 0
... ... ... ...
as1 as2 ... ast ... asn · 0 0 ... 0 ... 1 ... 0
... ... ... ...
am1 am2 ... amt ... amn 0 0 ... 0 ... 0 ... 0
(t) (n)
=
0 0 ... a1s ... 0
0 0 ... a2s ... 0
... ...
(s) 0 0 ... ass ... 0
... ...
(m) 0 0 ... asm ... 0
(t) (n)
由上可知,A 右乘 Es,t 的结果在效果上就相当于把 A 的第 s 列放到第 t 列,然后对其余列都作置 0 处理.
当 s = t 时,AEs,s 的结果相当于 A 中第 s 列保持不变,而把其余列都作置 0 处理. 易知
AE = AE1,1 + AE2,2 + ... + AEn,n = A
满足 UA = AU 的矩阵 A 的特性
全体 n 阶实方阵的集合记作 Mn(R),利用上面的矩阵单位特性可以证明如下定理:
在 Mn(R) 中,与任意矩阵可交换的矩阵是纯量阵 λE.
证明:假设 A ∈ Mn(R),对任意 U ∈ Mn(R) 满足 UA = AU.
令 U = E1,1,则 E1,1A = AE1,1
由上述矩阵单位的特性,有
a11 a12 ... a1,n-1 a1n a11 0 ... 0
0 0 ... 0 0 a21 0 ... 0
... ... = ... ...
0 0 ... 0 0 an-1,1 0 ... 0
0 0 ... 0 0 an1 0 ... 0
由此可知,A 的第 1 行和第 1 列上的元素,除 a11 之外,都为 0. 再令 U = Ei,i,i = 2, 3, ..., n,同理可得类似的结论,综合起来便有 A 的元素除对角线上的 aii (i = 1, 2, ..., n) 之外,都为 0.
令 U = E1,2,则 E1,2A = AE1,2
由上述矩阵单位的特性,有
a21 a22 ... a2,n-1 a2n 0 a11 0 ... 0
0 0 ... 0 0 0 a21 0 ... 0
... ... = ... ...
0 0 ... 0 0 0 an-1,1 0 ... 0
0 0 ... 0 0 0 an1 0 ... 0
由此可知,a11 = a22. 同理可得 a11 = aii (i = 3, ..., n),记 λ = a11,即有 A = λE.
对任意 U ∈ Mn(R),容易验证 U·(λE) = (λE)·U = λU,证毕.
(I) 型初等矩阵 Fs,t
(I) 型初等矩阵定义:
Fs,t = E - Es,s - Et,t + Es,t + Et,s,s ≠ t ①
由定义可知,Fs,t 为方阵;由定义的对称性可知,Fs,t = Ft,s
记 A 为任意 m×n 矩阵,且 Fs,t 为 m 阶方阵,则
Fs,t A = (E - Es,s - Et,t + Es,t + Et,s)·A = A - Es,sA - Et,tA + Es,tA + Et,sA
由上述矩阵单位的特性易知,A - Es,sA - Et,tA 就是把 A 中的第 s 行和第 t 行作置 0 处理,因此 A - Es,sA - Et,tA + Es,tA + Et,sA,即 Fs,t A,就是把 A 中的第 s 行和第 t 行作互换处理. 也就是说,矩阵 A 左乘 Fs,t 在效果上就等同于对 A 作一次 (I) 型初等行变换.
记 A 为任意 m×n 矩阵,且 Fs,t 为 n 阶方阵,则
AFs,t = A·(E - Es,s - Et,t + Es,t + Et,s) = A - AEs,s - AEt,t + AEs,t + AEt,s
同理可知,矩阵 A 右乘 Fs,t 在效果上就等同于对 A 作一次 (I) 型初等列变换:交换 A 的第 s 列和第 t 列.
综上可知,① 实际上是 (I) 型初等变换的分解式. 以列变换为例,就是依次把 A 中的第 s 列和第 t 列 置 0,再依次把 A 原来的第 s 列放置到第 t 列,把 A 原来的第 t 列放置到第 s 列. 注意定义中要求 s ≠ t,因为 s = t 时,① 的右端实际就是 E.
矩阵 Fs,t 中元素取值示意如下:
1 ... 0 ... 0 ... 0 ... 0
... ...
0 ... 0 ... 0 ... 1 ... 0 (s)
... ...
0 ... 0 ... 1 ... 0 ... 0
... ...
0 ... 1 ... 0 ... 0 ... 0 (t)
... ...
0 ... 0 ... 0 ... 0 ... 1
(s) (t)
若 Fs,t 为 n 阶方阵,则其中取值为 1 的元素就有 n 个,对角线上分布有 n - 2 个,另两个如梅色高亮所示. 易知 Fs,t · Fs,t = E,因而 (Fs,t)-1 = Fs,t.
(II) 型初等矩阵 Fs,t(λ)
(II) 型初等矩阵定义:
Fs,t(λ) = E + λEs,t,s ≠ t ②
由定义可知,Fs,t(λ) 为方阵.
记 A 为任意 m×n 矩阵,且 Fs,t(λ) 为 m 阶方阵,则
Fs,t(λ) A = (E + λEs,t)·A = A + λEs,tA
λEs,tA 是把 A 中的第 t 行乘上 λ 放到第 s 行,并对其余各行作置 0 处理,因此 A + λEs,tA,即 Fs,t(λ) A,就是把 A 中的第 t 行乘上 λ 加到第 s 行. 也就是说,矩阵 A 左乘 Fs,t(λ) 在效果上就等同于对 A 作一次 (II) 型初等行变换.
记 A 为任意 m×n 矩阵,且 Fs,t(λ) 为 n 阶方阵,则
AFs,t(λ) = A·(E + λEs,t) = A + λAEs,t
同理可知,矩阵 A 右乘 Fs,t(λ) 在效果上就等同于对 A 作一次 (II) 型初等列变换:把 A 的第 s 列乘上 λ 加到第 t 列.
显然,② 是 (II) 型初等变换的分解式. (II) 型初等矩阵的定义中同样要求 s ≠ t,因为 s = t 的情形对应的是 (III) 型初等变换.
矩阵 Fs,t(λ) 中元素取值示意如下:
1 ... 0 ... 0 ... 0 ... 0
... ...
0 ... 1 ... 0 ... λ ... 0 (s)
... ...
0 ... 0 ... 1 ... 0 ... 0
... ...
0 ... 0 ... 0 ... 1 ... 0 (t)
... ...
0 ... 0 ... 0 ... 0 ... 1
(s) (t)
易知 Fs,t(λ) · Fs,t(-λ) = E,因而 (Fs,t(λ))-1 = Fs,t(-λ).
(III) 型初等矩阵 Fs(λ)
(III) 型初等矩阵定义:
Fs(λ) = E + (λ - 1)Es,s ③
由定义可知,Fs(λ) 为方阵.
记 A 为任意 m×n 矩阵,且 Fs(λ) 为 m 阶方阵,则
Fs(λ) A = (E + (λ - 1)Es,s)·A = A + (λ - 1)Es,sA
(λ - 1)Es,sA 是把 A 中的第 s 行乘上 λ - 1,并对其余各行作置 0 处理,因此 A + (λ - 1)Es,sA,即 Fs(λ) A,就是把 A 中的第 s 行乘上 λ. 也就是说,矩阵 A 左乘 Fs(λ) 在效果上就等同于对 A 作一次 (III) 型初等行变换.
记 A 为任意 m×n 矩阵,且 Fs(λ) 为 n 阶方阵,则
AFs(λ) = A·(E + (λ - 1)Es,s) = A + (λ - 1)AEs,s
同理可知,矩阵 A 右乘 Fs(λ) 在效果上就等同于对 A 作一次 (III) 型初等列变换:把 A 的第 s 列乘上 λ.
显然,③ 是 (III) 型初等变换的分解式.
矩阵 Fs(λ) 中元素取值示意如下:
1 ... 0 ... 0 ... 0
... ...
0 ... λ ... 0 ... 0 (s)
... ...
0 ... 0 ... 1 ... 0
... ...
0 ... 0 ... 0 ... 1
(s)
易知 Fs(λ) · Fs(λ-1) = E,因而 (Fs(λ))-1 = Fs(λ-1).