一、相似矩阵
1. 特征值与特征向量
(1)定义
若 n n 阶矩阵 A A 满足 A α = λ α ( λ ≠ 0 ) A α = λ α ( λ ≠ 0 ) ,则 λ λ 是 A A 的特征值,α α 是 A A 的属于 λ λ 的特征向量,| λ E − A | = 0 | λ E − A | = 0 为 A A 的特征多项式。
【注】特征向量不能是零向量!
(2)特征值的性质
(2.1)设 A A 为 n n 阶矩阵,特征值为 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n ,则:
λ 1 + λ 2 + . . . + λ n = t r ( A ) = a 11 + a 22 + . . . + a n n λ 1 + λ 2 + . . . + λ n = t r ( A ) = a 11 + a 22 + . . . + a n n
λ 1 λ 2 ⋅ ⋅ ⋅ λ n = | A | λ 1 λ 2 · · · λ n = | A |
设 A A 有特征值 λ λ ,则 λ λ 的重数 k ≥ n − r ( λ E − A ) k ≥ n − r ( λ E − A )
若 r ( A ) ≤ 1 r ( A ) ≤ 1 ,则 A A 的特征值为 0 , 0 , . . . , 0 , t r ( A ) 0 , 0 , . . . , 0 , t r ( A ) (有 n − 1 n − 1 个 0 0 )
若 A A 为三角矩阵或对角矩阵,则 A A 的特征值为主对角线上的元素
若 α ≠ 0 α ≠ 0 ,则矩阵 α β T α β T 的特征值为 0 , 0 , . . . , 0 , β T α 0 , 0 , . . . , 0 , β T α ,其中特征值 β T α β T α 对应的特征向量为 α α
(2.2)设 A A 为 n n 阶实对称矩阵 ,则:
A A 的元素均为实数,且 A T = A A T = A
A A 的特征值必为实数
A = α β T + β α T A = α β T + β α T 为实对称矩阵
(3)特征向量的性质
(3.1)设 A A 为 n n 阶矩阵,则:
A A 的不同特征值对应的特征向量线性无关
A A 的不同特征值对应的特征向量之线性组合不是 A A 的特征向量
设 A A 有 k k 重特征值 λ λ ,则属于 λ λ 的线性无关的特征向量个数 s = n − r ( λ E − A ) ≤ k s = n − r ( λ E − A ) ≤ k
设 A A 有 k k 重特征值 λ λ ,则属于 λ λ 的线性无关的特征向量之线性组合仍为 A A 的特征向量
(3.2)设 A A 为 n n 阶实对称矩阵 ,则:
A A 的不同特征值 的特征向量相互正交
设 A A 有 k k 重特征值 λ λ ,则属于 λ λ 的线性无关的特征向量个数 s = n − r ( λ E − A ) = k s = n − r ( λ E − A ) = k
(4)常用结论
矩阵
A A
k A k A
A n A n
A + k E A + k E
f ( A ) f ( A )
A − 1 A − 1
A ∗ A ∗
P − 1 A P P − 1 A P
A T A T
特征值
λ λ
k λ k λ
λ n λ n
λ + k λ + k
f ( λ ) f ( λ )
1 λ 1 λ
| A | λ | A | λ
λ λ
λ λ
特征向量
α α
α α
α α
α α
α α
α α
α α
P − 1 α P − 1 α
不一定是 α α
【注 1】关于 A A 和 f ( A ) f ( A ) 的几个要点:
若 f ( A ) = 0 f ( A ) = 0 ,则 A A 的每个特征值 λ λ 都满足 f ( λ ) = 0 f ( λ ) = 0
若 f ( λ ) = 0 f ( λ ) = 0 求得解 λ 1 , λ 2 , . . . , λ t λ 1 , λ 2 , . . . , λ t ,则 A A 的特征值可能有 λ 1 , λ 2 , . . . , λ t λ 1 , λ 2 , . . . , λ t 的其中几个(或一个都没有!),但不能确定 A A 的特征值一定都有 λ 1 , λ 2 , . . . , λ t λ 1 , λ 2 , . . . , λ t
【注 2】一个可以快速计算矩阵 A A 的特征值的技巧:将 A A 拆分成数量矩阵 k E k E 加一个秩为 1 1 的矩阵 B B ,于是 A = B + k E A = B + k E ,矩阵 B B 的特征值容易写出,自然也就得到矩阵 A A 的特征值了。
2. 相似关系
(1)相似的定义
设 A , B A , B 为 n n 阶矩阵,若存在可逆矩阵 P P ,使得 P − 1 A P = B P − 1 A P = B (即 A P = P B A P = P B ),则称 A A 与 B B 相似 ,记作 A ∽ B A ∽ B 。
(2)相似的性质
(2.1)对称性和传递性:
对称性 :A ∽ B ⇔ B ∽ A A ∽ B ⇔ B ∽ A
传递性 :A ∽ B , B ∽ C ⇒ A ∽ C A ∽ B , B ∽ C ⇒ A ∽ C
(2.2)若 A ∽ B A ∽ B 且 P − 1 A P = B P − 1 A P = B 时,有:
A ∽ B ⇒ A T ∽ B T A ∽ B ⇒ A T ∽ B T
A ∽ B ⇒ A n ∽ B n A ∽ B ⇒ A n ∽ B n
A ∽ B ⇒ A − 1 ∽ B − 1 A ∽ B ⇒ A − 1 ∽ B − 1 ,并且 P − 1 A − 1 P = B − 1 P − 1 A − 1 P = B − 1 (当 A A 可逆时)
A ∽ B ⇒ A ∗ ∽ B ∗ A ∽ B ⇒ A ∗ ∽ B ∗ ,并且 P − 1 A ∗ P = B ∗ P − 1 A ∗ P = B ∗ (当 A A 可逆时)
A ∽ B ⇒ f ( A ) ∽ f ( B ) A ∽ B ⇒ f ( A ) ∽ f ( B ) ,并且 P − 1 f ( A ) P = f ( B ) P − 1 f ( A ) P = f ( B )
η η 是 A A 的特征向量 ⇔ P − 1 η ⇔ P − 1 η 是 B B 的特征向量
A ∽ B ⇒ | A | = | B | A ∽ B ⇒ | A | = | B |
A ∽ B ⇒ | λ E − A | = | λ E − B | A ∽ B ⇒ | λ E − A | = | λ E − B |
A ∽ B ⇒ r ( A ) = r ( B ) A ∽ B ⇒ r ( A ) = r ( B )
A ∽ B ⇒ t r ( A ) = t r ( B ) A ∽ B ⇒ t r ( A ) = t r ( B )
A ∽ B ⇒ A A ∽ B ⇒ A 和 B B 有相同的特征值
【注 1】由 A ∽ B A ∽ B 可得出以上结论,但反过来,这些条件却并不能得到 A ∽ B A ∽ B 。
【注 2】以上条件只要有一个不满足,即可判断 A A 不相似于 B B 。
【注 3】若要判断 A ∽ B A ∽ B ,则可尝试求出 A A 和 B B 的对角矩阵,若它们都相似于同一个对角矩阵(即 A ∽ Λ , B ∽ Λ A ∽ Λ , B ∽ Λ ),则根据相似的传递性,可得 A ∽ B A ∽ B 。
(2.3)设 A , B A , B 均为 n n 阶实对称矩阵 ,则:
A A 必相似于实对角矩阵,即 A ∽ Λ A ∽ Λ
A ∽ B ⇔ A A ∽ B ⇔ A 和 B B 有相同的特征值及重数 ⇔ | λ E − A | = | λ E − B | ⇔ | λ E − A | = | λ E − B |
【注】| λ E − A | = | λ E − B | ⇔ | λ E − A | = | λ E − B | ⇔ A A 和 B B 有相同的特征值及重数⇔ A ∽ Λ , B ∽ Λ ⇔ A ∽ B ⇔ A ∽ Λ , B ∽ Λ ⇔ A ∽ B
存在正交矩阵 Q Q ,使得 Q T A Q = Q − 1 A Q = Λ Q T A Q = Q − 1 A Q = Λ
3. 相似对角化
(1)相似对角化的定义
设 n n 阶对角矩阵 Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) ,其中 λ i λ i 为 A A 的特征值, 若存在可逆矩阵 P P ,使得 P − 1 A P = Λ P − 1 A P = Λ (即 A P = P Λ A P = P Λ ),则称 A A 可相似对角化 ,简称为可对角化 ,记作 A ∽ Λ A ∽ Λ 。
(2)可对角化的判别
(设 A A 为 n n 阶矩阵)
A A 有 n n 个不同的特征值 ⇒ A ∽ Λ ⇒ A ∽ Λ
A ∽ Λ ⇔ A A ∽ Λ ⇔ A 有 n n 个线性无关的特征向量
A ∽ Λ ⇔ A A ∽ Λ ⇔ A 的 k k 重特征值 λ λ 有 k k 个线性无关的特征向量 ⇔ k = n − r ( λ E − A ) ⇔ k = n − r ( λ E − A )
【注】当 k = 1 k = 1 时,k = n − r ( λ E − A ) k = n − r ( λ E − A ) 一定成立,因此只需对 k ≥ 2 k ≥ 2 的特征值进行判断。
A A 满足 ( A − a E ) ( A − b E ) = 0 ( a ≠ b ) ⇔ A ∽ Λ ( A − a E ) ( A − b E ) = 0 ( a ≠ b ) ⇔ A ∽ Λ ,且特征值满足 ( λ − a ) ( λ − b ) = 0 ( λ − a ) ( λ − b ) = 0
实对称矩阵必可相似对角化,且正交于对角矩阵
(3)相似对角化的步骤
(3.1)一般矩阵 A A 的相似对角化的步骤:
由 | λ E − A | = 0 | λ E − A | = 0 求出 A A 的特征值 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n
对每个 λ i λ i ,由 ( λ i E − A ) x = 0 ( λ i E − A ) x = 0 求出 A A 的一组特征向量 α 1 , α 2 , . . . , α n α 1 , α 2 , . . . , α n
令 P = ( α 1 , α 2 , . . . , α n ) P = ( α 1 , α 2 , . . . , α n ) ,当 P P 可逆时,有 P − 1 A P = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) P − 1 A P = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n )
【注】有些题目没有给出具体的矩阵 A A ,只给定一些已知的特征值和特征向量,要求反求出矩阵 A A 。有两种解法:
传统的解法:求出对角矩阵 Λ = d i a g ( λ 1 , λ 2 , λ 3 ) Λ = d i a g ( λ 1 , λ 2 , λ 3 ) 和可逆矩阵 P = ( α 1 , α 2 , α 3 ) P = ( α 1 , α 2 , α 3 ) ,然后由 P − 1 A P = Λ P − 1 A P = Λ 得到 A = P Λ P − 1 A = P Λ P − 1 。这种解法需要对 P P 求逆(需使用初等行变换求出),然后进行两次矩阵乘法。
较快的解法:求解矩阵 A A 的过程实际上是在求解一个矩阵方程 。因为 P − 1 A P = Λ ⇔ A P = P Λ ⇔ A ( α 1 , α 2 , α 3 ) = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) P − 1 A P = Λ ⇔ A P = P Λ ⇔ A ( α 1 , α 2 , α 3 ) = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) ,取转置即得矩阵方程 ( α 1 , α 2 , α 3 ) T A T = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) T ( α 1 , α 2 , α 3 ) T A T = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) T ,于是求解 A T A T 只需进行初等行变换:( α T 1 , α T 2 , α T 3 | λ 1 α T 1 , λ 2 α T 2 , λ 3 α T 3 ) → ( E | A T ) ( α 1 T , α 2 T , α 3 T | λ 1 α 1 T , λ 2 α 2 T , λ 3 α 3 T ) → ( E | A T ) 。显然该法比传统解法要更快!
(3.2)实对称矩阵 A A 的相似对角化的步骤:
由 | λ E − A | = 0 | λ E − A | = 0 求出 A A 的特征值 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n
对每个 λ i λ i ,由 ( λ i E − A ) x = 0 ( λ i E − A ) x = 0 求出 A A 的一组特征向量 α 1 , α 2 , . . . , α n α 1 , α 2 , . . . , α n
对单重特征值的特征向量进行单位化 ;对多重特征值对应的特征向量进行施密特正交化 和单位化
令正交矩阵 Q = ( η 1 , η 2 , . . . , η n ) Q = ( η 1 , η 2 , . . . , η n ) ,有 Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n )
【注 1】有些题目没有给出具体的实对称矩阵 A A ,只给出其中一个或两个特征向量 α α ,若需要算出其他的特征向量,应使用“实对称矩阵的不同特征值的特征向量相互正交”这一性质来求解。
【注 2】有些题目没有给出具体的实对称矩阵 A A ,只给定一些已知的特征值和特征向量,要求反求出实对称矩阵 A A ,一种比较快的解法是使用谱分解定理 ,在本人专栏有涉及。
(3.3)施密特正交化
⎧ ⎪
⎪
⎪
⎪
⎪
⎪ ⎨ ⎪
⎪
⎪
⎪
⎪
⎪ ⎩ β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 { β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2
【注】施密特正交化的推导过程以及其延伸出的一些解题思路,可见本人专栏的另一篇文章。
(3.4)单位化
⎧ ⎪ ⎨ ⎪ ⎩ η 1 = β 1 / | | β 1 | | η 2 = β 2 / | | β 2 | | η 3 = β 3 / | | β 3 | | { η 1 = β 1 / | | β 1 | | η 2 = β 2 / | | β 2 | | η 3 = β 3 / | | β 3 | |
(| | β i | | | | β i | | 为向量的长度)
令正交矩阵 Q = ( η 1 , η 2 , η 3 ) Q = ( η 1 , η 2 , η 3 ) ,有 Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , λ 3 ) Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , λ 3 )
二、合同矩阵
1. 二次型
(1)二次型的定义
二次型 :f ( x 1 , x 2 , . . . , x n ) = x T A x f ( x 1 , x 2 , . . . , x n ) = x T A x ,其中 A A 是实对称矩阵。
标准二次型 :若交叉项的系数为 0 0 ,则得到标准二次型 ,A A 是实对角矩阵。
规范二次型 :若每一项去掉系数,只保留正负,则得到规范二次型 ,A A 是实规范对角矩阵,即 ⎡ ⎢ ⎣ E p − E q O ⎤ ⎥ ⎦ [ E p − E q O ] ,其中 p p 为正惯性指数 (正平方项个数),q q 为负惯性指数 (负平方项个数)。
【注 1】标准二次型是不唯一的,规范二次型是唯一的。
【注 2】部分二次型所对应的矩阵不是实对称矩阵,则需要将其改成实对称矩阵:B = 1 2 ( A + A T ) B = 1 2 ( A + A T ) 。相关例题:f ( x 1 , x 2 , x 3 ) = ( x 1 + 2 x 2 + 3 x 3 ) ( x 1 − 2 x 2 + 3 x 3 ) f ( x 1 , x 2 , x 3 ) = ( x 1 + 2 x 2 + 3 x 3 ) ( x 1 − 2 x 2 + 3 x 3 ) 。
可逆线性变量替换 :对二次型 f ( x 1 , x 2 , . . . , x n ) = x T A x f ( x 1 , x 2 , . . . , x n ) = x T A x 引进新变量 y 1 , y 2 , . . . , y n y 1 , y 2 , . . . , y n 用来表示 x 1 , x 2 , . . . , x n x 1 , x 2 , . . . , x n :
⎧ ⎪
⎪
⎪ ⎨ ⎪
⎪
⎪ ⎩ x 1 = c 11 y 1 + c 12 y 2 + . . . + c 1 n y n x 2 = c 21 y 1 + c 22 y 2 + . . . + c 2 n y n . . . . . . . . . . . . . . . . . . x 3 = c n 1 y 1 + c n 2 y 2 + . . . + c n n y n { x 1 = c 11 y 1 + c 12 y 2 + . . . + c 1 n y n x 2 = c 21 y 1 + c 22 y 2 + . . . + c 2 n y n . . . . . . . . . . . . . . . . . . x 3 = c n 1 y 1 + c n 2 y 2 + . . . + c n n y n
将其中的系数矩阵记为 C C ,若 C C 为可逆矩阵,则称为可逆线性变量替换 ,上式又可写成:x = C y x = C y ,所以二次型可化为:f ( x 1 , x 2 , . . . , x n ) = y T C T A C y f ( x 1 , x 2 , . . . , x n ) = y T C T A C y ,可逆线性变量替换后的二次型为 g ( y 1 , y 2 , . . . , y n ) = C T A C g ( y 1 , y 2 , . . . , y n ) = C T A C 。
【注】坐标变换必须可逆,若不可逆则变换后的结果不是二次型 f f 的标准型。相关例题:f ( x 1 , x 2 , x 3 ) = ( x 1 + x 2 ) 2 + ( x 2 − x 3 ) 2 + ( x 3 + x 1 ) 2 f ( x 1 , x 2 , x 3 ) = ( x 1 + x 2 ) 2 + ( x 2 − x 3 ) 2 + ( x 3 + x 1 ) 2 。
(2)惯性定理
标准二次型 f = x T A x f = x T A x 中,A A 是实对称矩阵 ,p p 为正惯性指数(正平方项个数),q q 为负惯性指数(负平方项个数),则 r ( A ) = p + q r ( A ) = p + q 。
【注】必须是在实对称矩阵的条件下!
【一类特殊的二次型】已知二次型
f ( x 1 , x 2 , x 3 ) = ( a 1 x 1 + a 2 x 2 + a 3 x 3 ) 2 + ( b 1 x 1 + b 2 x 2 + b 3 x 3 ) 2 + ( c 1 x 1 + c 2 x 2 + c 3 x 3 ) 2 f ( x 1 , x 2 , x 3 ) = ( a 1 x 1 + a 2 x 2 + a 3 x 3 ) 2 + ( b 1 x 1 + b 2 x 2 + b 3 x 3 ) 2 + ( c 1 x 1 + c 2 x 2 + c 3 x 3 ) 2
记 α = ( a 1 , a 2 , a 3 ) T , β = ( b 1 , b 2 , b 3 ) T , γ = ( c 1 , c 2 , c 3 ) T α = ( a 1 , a 2 , a 3 ) T , β = ( b 1 , b 2 , b 3 ) T , γ = ( c 1 , c 2 , c 3 ) T ,则二次型 f ( x 1 , x 2 , x 3 ) f ( x 1 , x 2 , x 3 ) 对应矩阵为 A = ( α , β , γ ) ( α , β , γ ) T A = ( α , β , γ ) ( α , β , γ ) T ,正惯性指数 p = r ( α , β , γ ) p = r ( α , β , γ ) ,负惯性指数 q = 0 q = 0 。
(3)最大和最小值
设 n n 元二次型 f = x T A x f = x T A x ,其中实对称矩阵 A A 的特征值 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n 中最大值为 λ m a x λ m a x ,最小值为 λ m i n λ m i n ,且 x T A x = M > 0 x T A x = M > 0 ,则有:
M λ m i n ≤ x T A x ≤ M λ m a x M λ m i n ≤ x T A x ≤ M λ m a x
(4)二次型的标准化(合同对角化)
(4.1)正交变换法
由 | λ E − A | = 0 | λ E − A | = 0 求出二次型矩阵 A A 的特征值 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n
对每个 λ i λ i ,由 ( λ i E − A ) x = 0 ( λ i E − A ) x = 0 求出 A A 的一组特征向量 α 1 , α 2 , . . . , α n α 1 , α 2 , . . . , α n
对单重特征值的特征向量进行单位化 ;对多重特征值对应的特征向量进行施密特正交化 和单位化
令正交矩阵 Q = ( η 1 , η 2 , . . . , η n ) Q = ( η 1 , η 2 , . . . , η n ) ,有可逆线性变量替换 x = Q y x = Q y ,把原二次型化为标准二次型,A A 的特征值 λ 1 , λ 2 , . . . , λ n λ 1 , λ 2 , . . . , λ n 对应标准二次型中每一项的系数
(4.2)拉格朗日配方法
若二次型中有平方项 x 2 i x i 2 和交叉项 x i x j x i x j ,则把含有 x i x i 的项集中起来进行配方
若二次型中仅有交叉项 x i x j x i x j ,则进行以下换元,此时将产生出平方项,按第一种方法进行配方:
⎧ ⎪ ⎨ ⎪ ⎩ x i = y i + y j x j = y i − y j x k = y k ( k = 1 , 2 , . . . , n ) ( k ≠ i , j ) { x i = y i + y j x j = y i − y j x k = y k ( k = 1 , 2 , . . . , n ) ( k ≠ i , j )
也可使用公式 a b = ( a + b ) 2 − ( a − b ) 2 4 a b = ( a + b ) 2 − ( a − b ) 2 4 产生出平方项
【例】用配方法将二次型 f ( x 1 , x 2 , x 3 ) = x 1 x 2 + x 2 x 3 + x 1 x 3 f ( x 1 , x 2 , x 3 ) = x 1 x 2 + x 2 x 3 + x 1 x 3 化为标准型。
【解】根据交叉项 x 1 x 2 x 1 x 2 可进行以下换元(当然也可以挑选其他交叉项进行换元):
⎧ ⎪ ⎨ ⎪ ⎩ x 1 = y 1 + y 2 x 2 = y 1 − y 2 x 3 = y 3 { x 1 = y 1 + y 2 x 2 = y 1 − y 2 x 3 = y 3
所以 f ( x 1 , x 2 , x 3 ) = y 2 1 + y 2 2 + 2 y 1 y 3 f ( x 1 , x 2 , x 3 ) = y 1 2 + y 2 2 + 2 y 1 y 3 ,配方得 f ( x 1 , x 2 , x 3 ) = ( y 1 + y 3 ) 2 − y 2 2 − y 2 3 f ( x 1 , x 2 , x 3 ) = ( y 1 + y 3 ) 2 − y 2 2 − y 3 2 。
2. 合同关系
(1)合同的定义
设 n n 阶矩阵 A , B A , B ,若存在可逆 实矩阵 C C ,使得 B = C T A C B = C T A C ,则称 A A 和 B B 合同,记为 A ≃ B A ≃ B 。
【注】在矩阵合同的定义中,并没有要求合同的矩阵一定是实对称矩阵。
(2)合同的性质
(2.1)一般矩阵的性质(设 A , B A , B 为一般矩阵):
两个二次型(分别对应实对称矩阵 A , B A , B )可用可逆线性变量替换 互相转化 ⇔ A ≃ B ⇔ A ≃ B
A ≃ B ⇔ A ≃ B ⇔ 正、负惯性指数相同,即 p A = p B , q A = q B p A = p B , q A = q B
A ≃ B ⇔ A ≃ B ⇔ 正、负特征值个数相同
A ≃ B ⇒ r ( A ) = r ( B ) A ≃ B ⇒ r ( A ) = r ( B )
【注】A ≃ B ⇒ p A = p B , q A = q B ⇒ r ( A ) = r ( B ) A ≃ B ⇒ p A = p B , q A = q B ⇒ r ( A ) = r ( B ) ,但 r ( A ) = r ( B ) ⇏ A ≃ B r ( A ) = r ( B ) ⇏ A ≃ B ,只能推出 A A 和 B B 等价(若 A , B A , B 同型)。
【注】这是在一般矩阵 下的得出的结论:
合同不一定相似 :很容易理解,合同只能推出矩阵 A , B A , B 所对应的对角矩阵元素的正负个数相等,但无法推出对角矩阵元素均相等。
相似不一定合同 :由 A ∽ B A ∽ B 可得 P − 1 A P = B P − 1 A P = B ,但无法保证 P − 1 = P T P − 1 = P T 。
(2.2)实对称矩阵的性质(设 A , B A , B 为实对称矩阵):
实对称矩阵必能合同对角化,即 C T A C = Λ C T A C = Λ
若 A A 为实对称矩阵,则:A ≃ B ⇒ B A ≃ B ⇒ B 为实对称矩阵
【证明】A ≃ B ⇒ C T A C = B ⇒ ( C T A C ) T = ( B ) T ⇒ C T A T C = B T = B A ≃ B ⇒ C T A C = B ⇒ ( C T A C ) T = ( B ) T ⇒ C T A T C = B T = B ,说明 B B 也为实对称矩阵。
A ∽ B ⇒ A ≃ B A ∽ B ⇒ A ≃ B ,但 A ∽ B ⇍ A ≃ B A ∽ B ⇍ A ≃ B
【注】这是在实对称矩阵 下的得出的结论:
相似是合同的特例 :实对称矩阵必与对角矩阵相似,可得 A ∽ B ⇒ A ∽ B ∽ Λ A ∽ B ⇒ A ∽ B ∽ Λ ,所以 A , B A , B 有相同的特征值,即 A , B A , B 有相同的正、负惯性指数,由惯性定理知 A ≃ B A ≃ B 。
合同不一定相似 :很容易理解,合同只能推出矩阵 A , B A , B 所对应的对角矩阵元素的正负个数相等,但无法推出对角矩阵元素均相等。
3. 正定矩阵
(1)正定的定义
设二次型 f ( x 1 , x 2 , . . . , x n ) = x T A x f ( x 1 , x 2 , . . . , x n ) = x T A x ,其中 A A 是实对称矩阵。若对任意 x ≠ 0 x ≠ 0 ,都有 f ( x 1 , x 2 , . . . , x n ) = x T A x > 0 f ( x 1 , x 2 , . . . , x n ) = x T A x > 0 ,则称二次型 f f 正定 ,称 A A 为正定矩阵 。
【注 1】判定矩阵 A A 正定时,需要检验 A A 是否为实对称矩阵。
【注 2】若二次型 f f 正定,则仅当 x = 0 x = 0 时,f ( x 1 , x 2 , . . . , x n ) = x T A x = 0 f ( x 1 , x 2 , . . . , x n ) = x T A x = 0 。
(2)正定的性质
A A 正定 ⇒ A ⇒ A 为实对称矩阵
A A 正定 ⇔ A ⇔ A 的特征值全部大于 0 0
A A 正定 ⇔ A ⇔ A 的顺序主子式全大于 0 0
A A 正定 ⇔ ∃ 可 逆 P ⇔ ∃ 可 逆 P ,使得 A = P T P ⇔ A ≃ E A = P T P ⇔ A ≃ E
A A 正定 ⇒ a i i > 0 ⇒ a i i > 0
A A 正定 ⇒ | A | > 0 ⇒ | A | > 0
A A 正定 ⇒ A k , A − 1 , A ∗ ⇒ A k , A − 1 , A ∗ 均正定
[ A O O B ] [ A O O B ] 正定 ⇔ A , B ⇔ A , B 均正定
对于实矩阵 A T A A T A :
A T A A T A 的负惯性指数为 0 0
若 r ( A ) = n r ( A ) = n ,则 A T A A T A 正定
【证明】(1)首先证明矩阵 A T A A T A 为实对称矩阵。因为 ( A T A ) T = A T ( A T ) T = A T A ( A T A ) T = A T ( A T ) T = A T A ,所以 A T A A T A 为实对称矩阵。
(2)现在用特征值证明其正定。设 λ λ 是矩阵 A T A A T A 的特征值,所对应的特征向量为 α α ,则有:A T A α = λ α A T A α = λ α ,等式两边同乘 α T α T 得:α T A T A α = λ α T α α T A T A α = λ α T α ,化为内积形式即:( A α , A α ) = λ ( α , α ) ( A α , A α ) = λ ( α , α ) ,显然 λ ≥ 0 λ ≥ 0 ,矩阵 A T A A T A 负惯性指数为 0 0 。
(3)当 r ( A ) = n r ( A ) = n 时,表示 A x = 0 A x = 0 仅有非零解,所以 A α ≠ 0 A α ≠ 0 ,( A α , A α ) > 0 ( A α , A α ) > 0 ,显然 λ > 0 λ > 0 ,矩阵 A T A A T A 正定。
三、等价关系
1. 等价的定义
若矩阵 A A 经过有限次初等变换变成矩阵 B B ,则称矩阵 A A 与矩阵 B B 等价,记为 A ≅ B A ≅ B 。
2. 等价的判定
若 A , B A , B 是同型矩阵,则:
A ≅ B ⇔ A A ≅ B ⇔ A 经过初等变换得到 B B
A ≅ B ⇔ P A Q = B A ≅ B ⇔ P A Q = B ,其中 P , Q P , Q 可逆
A ≅ B ⇔ r ( A ) = r ( B ) A ≅ B ⇔ r ( A ) = r ( B )
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2022-08-16 【组成原理-数据】浮点数的编码与运算
2021-08-16 STM32学习笔记(9)——(I2C续)读写EEPROM