么正矩阵(酉矩阵)
本文的阅读等级:中级
一实(或复) 正交矩阵(orthogonal matrix) 是一个实(或复) 方阵满足
,
即 。 写出 阶实正交矩阵的行向量(column vector) 表达, ,则 ,矩阵乘积 的 元等于 与 的内积。 因此, 若 , 若 。 换句话说,实正交矩阵 的行向量 是向量空间 的一组单范正交基底(orthonormal basis),单范表示归一, 是单位向量,正交意味 垂直 。 不过,复正交矩阵的行向量并非 的一个单范正交集,因为两个复向量 与 的内积定义为 (见“ 内积的定义 ”)。 如欲将实正交矩阵推广至复矩阵,将转置改为共轭转置。 一么正矩阵(酉矩阵,unitary matrix) 是一个复方阵满足
,
即 。 同样地,设 ,则 。 么正矩阵的行向量 是向量空间 的一组单范正交基底。 例如,
,
其中 。 因为 ,若 是一么正矩阵,则 也是么正矩阵。 所以,么正矩阵 的共轭列向量(row vector) 构成 的一个单范正交集(事实上, 的列向量即构成单范正交集,因为 , 也是么正矩阵)。 类似地,实正交矩阵 的列向量构成 的一个单范正交集。 在一般情况下,么正矩阵与复正交矩阵是不同的,但实么正矩阵与实正交矩阵是相同的。 所以,么正矩阵的所有性质皆可套用于实正交矩阵。
么正矩阵出现于许多矩阵分解式,举两个例子。 第一是矩阵三角化的Schur 定理:任一方阵 可分解为 ,其中 是一么正矩阵, 是上三角矩阵(见“ 矩阵三角化的Schur定理 ”)。 第二是正规矩阵(normal matrix) 的么正对角化(unitarily diagonalizable):若 为一正规矩阵, ,则存在一么正矩阵 使得 ,其中 为一对角矩阵(见“ 特殊矩阵(2):正规矩阵 ”)。 事实上,可么正对角化是正规矩阵的一个充要条件。
以下令 为一 阶么正矩阵,所有的性质都是由定义式得来。
性质1 .向量的长度不因么正变换而改变,即每一 ,
。
性质1说明么正变换是一个保长((length-preserving) 变换。使用定义式,
。
反过来说,若所有向量 都满足 ,平方后整理可得 ,可知 ,并推得 。 所以,保长是么正矩阵的一个充要条件。
性质2 .两向量的内积不因么正变换而改变,即任何 ,
。
性质2说明么正变换具有内积不变性。 使用定义式,
。
将上式的 替换为 ,性质2可推得性质1。 所以,内积不变性是么正矩阵的另一个充要条件。
性质3 .么正矩阵的特征值之绝对值为 。
假设 ,等号两边同时取向量长度。 利用性质1,等号左边为 ,但等号右边为 ,所以 ,换句话说,么正矩阵的特征值可表示为 。
性质4 .么正矩阵 可么正对角化, ,其中 是一么正矩阵, 。
么正矩阵 满足 ,因此属于正规矩阵家族,本身也可被么正对角化。 下面介绍 对应相异特征值的特征向量互为正交的一个证明。 假设非零向量 与 使得 , ,且 。 使用性质2,
。
比较等号两边,推得 或 。 使用性质三,令 ,则 。 但已知 不等于 ,推论 ,证明 正交于 。
性质5 .么正矩阵 的行列式为 。
根据性质3, 的特征值满足 。 行列式等于特征值之积,故 。 另一个作法计算
,
但 ,所以 。
对于一实正交矩阵 , 为实数,由性质5可知 。 据此,实正交矩阵可以区分为两类:若 ,则 称为适当的(proper) 的正交矩阵;若 ,则 称为不适当的正交矩阵。 令 是平面上逆时针旋转角为 的旋转矩阵, 是平面上以 为镜射轴指向的镜射矩阵,公式如下(见“ 几何变换矩阵的设计 ”):
。
因为 ,平面旋转是适当的正交矩阵。 另一方面, ,平面镜射是不适当的正交矩阵(见“ 旋转与镜射 ”)。 平面旋转与镜射是保长变换,提示我们这两种矩阵是实正交矩阵。
最后补充一个么正矩阵的充分条件:假设 阶矩阵 的特征值 满足 。 若每一 使得 ,则 是一个么正矩阵(见“ 每周问题July 6, 2015 ”)。 注解提供两个证明:第一个证明使用奇异值分解[1] ,第二个证明使用矩阵三角化的Schur定理[2] 。
注解
[1] 令 的特征值为 ,奇异值为 。 给定的不等式等价于
,
其中 。 令 的奇异值分解为 ,其中 且 。 使用恒等式 ,又 且 ,推得 。 但 ,可知 。 因此, ,即知 ,证明 是一么正矩阵。
[2] 根据Schur 定理,写出 ,其中 是么正矩阵, 是上三角矩阵,主对角元为 的特征值 ,每一 。 考虑 ,其中 是第 个标准单位向量,则 。 我们得到
。
对于单位向量 ,给定条件等价于 ,再有 ,使得 , 。 套用归纳法,重复上述步骤令 , ,可推论 是一个对角矩阵满足 (因为 )。 所以,
。
如果这篇文章帮助到了你,你可以请作者喝一杯咖啡