矩阵论 - 8 - 求解Ax=b:可解性和解的结构
求解Ax=b:可解性和解的结构
可解的条件 Solvability conditions on b
Q:给定 \( A= \begin{bmatrix} 1 & 2 & 2 & 2\\ 2 & 4 & 6 & 8\\ 3 & 6 & 8 & 10\\ \end{bmatrix} \),求\(Ax=b\)的解?
方程 \(Ax=b\) 可以表示为:\(\begin{bmatrix} 1 & 2 & 2 & 2\\2 & 4 & 6 & 8\\3 & 6 & 8 & 10\\ \end{bmatrix} \begin{bmatrix} x_1\\x_2\\x_3\\x_4\\ \end{bmatrix} =\begin{bmatrix} b_1\\b_2\\b_3\\ \end{bmatrix}\)
写出其增广矩阵(augmented matrix)\(\left[\begin{array}{c|c}A & b\end{array}\right]\):
显然,有解的必要条件为\(b_3-b_2-b_1=0\)。
Q:\(b\) 满足什么条件才能让方程 \(Ax=b\) 有解(solvability condition on b)?
当且仅当 \(b\) 属于 \(A\) 的列空间时。
本讲推导出矩阵 \(A\) 的行向量若经过线性组合成为了零向量,则对应的 \(b\) 经同样的线性组合后也要等于 \(0\)。
这两点是等价的。
求解Ax=b
通解 Complete solution
为求得 \(Ax=b\) 的所有解,我们首先检验方程是否可解,然后找到一个特解。将特解和矩阵零空间的向量相加即为方程的通解。
In order to find all solutions to \(Ax=b\) we first check that the equation is solvable, then find a particular solution. We get the complete solution of the equation by adding the particular solution to all the vectors in the nullspace.
特解 A particular solution
求 \(Ax=b\) 特解的方法是将自由变量均赋值为0,求解其主变量。
对于上文的例子,令 \(x_2=x_4=0\),有 \( \Big\lbrace \begin{eqnarray*} x_1 & + & 2x_3 & = & 1 \\ & & 2x_3 & = & 3 \\ \end{eqnarray*} \),解得 \(\Big\lbrace\begin{eqnarray*}x_1 & = & -2 \\x_3 & = & \frac{3}{2} \\\end{eqnarray*}\),代入 \(Ax=b\) ,可以求得特解\( x_p= \begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix} \)。
主元列和自由列的一个重要区别就是,自由列可以表示为其左侧所有主元列的线性组合,而主元列则不可以。
\[\begin{bmatrix} \underline{*} & * & * & *\\ 0 & 0 & \underline{*} & *\\ 0 & 0 & 0 & \underline{*}\\ \end{bmatrix}\]对于 \(Ax=b\) 的求解转变为 \(Ux=c\),其中 \(c\) 是向量经过与 \(Ax\)相同的行操作得到的向量。(使用增广矩阵)
将 \(x\) 中的自由变量赋值为0就可以去掉自由列的列向量的干扰,从而求得方程的特解 \(x_p\)。
如果消元得到的行阶梯矩阵 \(U\) 最后i行为0,就要求的 \(c\) 最后i个分量为0,这时主元列才可以通过线性组合得到 \(c\),否则无解。
与零空间进行线性组合 Combined with nullspace
令\(Ax=b\)成立的所有解:
即 \(x_{complete}=x_p+x_n\), \(x_p\) 为矩阵 \(A\) 的特解,\(x_n\) 为矩阵零空间的一般向量。
即 \(Ax=b\)的解集为其特解+零空间。
对于上文的例子,根据 \(Ax=0\) 求得 \(A\) 的零空间(前篇文章已求得)为\(c_1\begin{bmatrix}-2\\1\\0\\0\\\end{bmatrix}+c_2\begin{bmatrix}2\\0\\-2\\1\\\end{bmatrix}\)
所以可以求得上文例子的通解 \(x_{complete}=x_p+x_n=\begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix} + c_1\begin{bmatrix}-2\\1\\0\\0\\\end{bmatrix} + c_2\begin{bmatrix}2\\0\\-2\\1\\\end{bmatrix}\),式中 \(c_1\) 和 \(c_2\) 为任意实数。
矩阵的零空间\(N(A)\)是\(\mathbb{R}^4\)空间中的二维子空间,方程 \(Ax=b\) 的解构成了穿过 \(x_p\) 点并和矩阵零空间平行的“平面“。但该”平面“并不是空间 \(\mathbb{R}^4\) 的子空间。
秩 Rank
矩阵的秩等于矩阵的主元数。如果mxn矩阵的秩为r,则必有r<=m且r<=n。
讨论满秩(full rank)的情形:
-
列满秩:r=n。每列都有主元,\(x\) 的每一个分量都是主变量,没有自由变量。零空间\(N(A)\)之内只有零向量。方程 \(Ax=b\) 无解或者有唯一解 \(x_p\)。example:\( A= \begin{bmatrix} 1 & 3 \\ 2 & 1 \\ 6 & 1 \\ 5 & 1 \\ \end{bmatrix} \)
-
行满秩:r=m。每行都有主元,无论 \(b\) 取何值,方程 \(Ax=b\) 都有解。主变量r个,自由变量n-r个。example:\( A= \begin{bmatrix} 1 & 2 & 6 & 5 \\ 3 & 1 & 1 & 1 \\ \end{bmatrix} \)
-
行列满秩情况:r=m=n,矩阵可逆,零空间只有零向量,无论 \(b\) 取何值,方程 \(Ax=b\) 都有唯一解。example:\( A= \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ \end{bmatrix} \),则\(A\)最终可以化简为\(R=I\)。
总结:秩决定了方程组解的数量。
mxn给出了矩阵的尺寸,但是秩r给出的是矩阵的实际“大小”。
总结
求解 \(Ax=b\) 的步骤:
- 变化为行阶梯形矩阵 \(U\)
- 看是否可解
- 求特解:将自由变量均赋值为0,求解其主变量。
- 求零解:求 \(Ax=0\)的解
- 特解和零解的线性组合即是 \(Ax=b\) 的通解
reference
[1] textbook
[2] mit18.06学习笔记-0
[3] mit18.06学习笔记-1