基变换

概要

主要介绍了几个基本概念:基的表示,线性变换矩阵,以及进一步地理解。
 


定义以及记号

\(\mathscr{B}_1\)\(n\) 维向量空间 \(V\) 的一组基,记
\begin{align}
\mathscr{B}_1=\{ v_1 ,v_2, \cdots , v_n \}
\end{align}

对于给定的基 \(\mathscr{B}_1\),我们定义一个由 \(V\)\(\mathbf{F}^n\) 的映射

\begin{align}
x \rightarrow [x]_{\mathscr{B}_1}=
\begin{bmatrix}
\alpha_1 \\
\vdots \\
\alpha_n
\end{bmatrix} \qquad
\text{其中 } x=\alpha_1 v_1 + \alpha_2v_2+ \cdots + \alpha_n v_n
\end{align}

显然该映射是一对一的,同时是到上的

假设 \(T\) 是一个给定的 \(V \rightarrow V\) 的线性变换,一旦给定 \(Tv_1,Tv_2,\cdots,Tv_n\), 对于 \(\forall x \in V\) 我们就可以确定 \(Tx\) 的值。原因是 \(x=\alpha_1 v_1 + \alpha_2v_2+ \cdots + \alpha_n v_n\) 有唯一的表示,且有线性关系知
\begin{align}
Tx &=T(\alpha_1 v_1 + \alpha_2v_2+ \cdots + \alpha_n v_n) \notag \\
&=T(\alpha_1 v_1)+T(\alpha_2 v_2)+\cdots+T(\alpha_n v_n) \notag\\
&= \alpha_1 Tv_1 + \alpha_2 Tv_2 +\cdots+ \alpha_n Tv_n
\end{align}
因此一旦知道 \([x]_{\mathscr{B}_1}\)\(Tx\) 随之也确定了。

我们知道一个空间的基并不是唯一的,要介绍基的变换,自然要引入另一组基,不妨用 \(\mathscr{B}_2\) 表示
\begin{align}
\mathscr{B}_2=\{ w_1 ,w_2, \cdots, w_n \}
\end{align}
先定义向量 \(Tv_j\) 在基 \(\mathscr{B}_2\) 下的坐标为
\begin{align}
[Tv_j] _{\mathscr{B}_2}=
\begin{bmatrix}
t_{1j} \\
\vdots \\
t_{nj}
\end{bmatrix}
\label{tt1}
\end{align}
则对于 \(\forall x \in V\),我们有
\begin{align}
[Tx]_{\mathscr{B}_2} &=\bigg[\sum_{j=1}^n \alpha_j Tv_j \bigg]_{\mathscr{B}_2} = \sum_{j=1}^n \alpha_j [Tv_j]_{\mathscr{B}_2} \notag \\
&= \sum_{j=1}^n \alpha_j
\begin{bmatrix}
t_{1j} \\
\vdots \\
t_{nj}
\end{bmatrix} =
\begin{bmatrix}
t_{11} &\cdots & t_{1n} \\
\vdots & \ddots &\vdots \\
t_{n1} &\cdots & t_{nn}
\end{bmatrix}
\begin{bmatrix}
\alpha_1 \\
\vdots \\
\alpha_n
\end{bmatrix}
\label{tt2}
\end{align}
由式 \ref{tt1} 和式 \ref{tt2} 知 \(n\) 维方阵 \([t_{ij}]\) 只依赖于线性变换 \(T\) 和两组基 \(\mathscr{B}_1,\mathscr{B}_2\),而和向量 \(x\) 无关
我们再定义 \(T\)\(\mathscr{B}_1-\mathscr{B}_2\) 基表示

\begin{align}
_{\mathscr{B}_2}[T]_{\mathscr{B}_1}=
\begin{bmatrix}
t_{11} &\cdots & t_{1n} \\
\vdots & \ddots &\vdots \\
t_{n1} &\cdots & t_{nn}
\end{bmatrix} =
\big[
[Tv_1]_{\mathscr{B}_2} \cdots [Tv_n]_{\mathscr{B}_2}
\big]
\end{align}

总结一下,其实就是 \([Tx]_{\mathscr{B}_2}={}_{\mathscr{B}_2}[T]_{\mathscr{B}_1} \cdot [x]_{\mathscr{B}_1},\forall x \in V\).\ 一个特殊情况,当 \(\mathscr{B}_1=\mathscr{B}_2\) 时,我们称 \(_{\mathscr{B}_1}[T]_{\mathscr{B}_1}\)\(T\)\(\mathscr{B}_1\) 基表示

 

进一步理解

先考虑单位线性变换 \(I:V \rightarrow V\),根据上一部分的内容,对 \(\forall x \in V\),有
\begin{align}
[x]_{\mathscr{B}_2}=[Ix]_{\mathscr{B}_2} = {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot [x]_{\mathscr{B}_1} = {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot [Ix]_{\mathscr{B}_1}= {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2} \cdot [x]_{\mathscr{B}_2}
\label{tt3}
\end{align}
取遍所有的基,即依次取 \(x=w_1,w_2,\cdots,w_n\),式 \ref{tt3} 能够得出
\begin{align}
{}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2}= I_n
\end{align}
这里必须取遍所有基,避免出现不动点的情况,而导致条件不充分。相反,如果从 \([x]_{\mathscr{B}_1}=[Ix]_{\mathscr{B}_1}=\cdots\) 开始计算,会得出
\begin{align}
{}_{\mathscr{B}_1}[I]_{\mathscr{B}_2} \cdot {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1}= I_n
\end{align}

因此,记 \(S\equiv{}_{\mathscr{B}_2}[I]_{\mathscr{B}_1}\),则 \(S^{-1} = {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2}\),实际上,形如 \({}_{\mathscr{B}_2}[I]_{\mathscr{B}_1}\) 的矩阵都是可逆的,反过来,每一个可逆阵 \(S=[s_1 \, s_2 \cdots s_n] \in M_n(\mathbf{F})\) 对某个基 \(\mathscr{B}\) 也有形式 \({}_{\mathscr{B}_1}[I]_\mathscr{B}\),可以把 \(\mathscr{B}\) 看成是由 \([\tilde{s}_i]_{\mathscr{B}_1}=s_i,\, i=1,2,\cdots,n\) 定义的向量组 \(\{\tilde{s}_1,\tilde{s}_2,\cdots,\tilde{s}_n\}\). 因为 \(S\) 可逆,所以向量组 \(\mathscr{B}\) 线性无关。

注意到
\begin{align}
_{\mathscr{B}_2}[I]_{\mathscr{B}_1}=
\big[
[Iv_1]_{\mathscr{B}_2} \cdots [Iv_n]_{\mathscr{B}_2}
\big] =
\big[
[v_1]_{\mathscr{B}_2} \cdots [v_n]_{\mathscr{B}_2}
\big]
\end{align}
于是 \(_{\mathscr{B}_2}[I]_{\mathscr{B}_1}\) 是用基 \(\mathscr{B}_2\) 来表示基 \(\mathscr{B}_1\) 的各个元素。现在令 \(x \in V\) ,经计算
\begin{align}
{}_{\mathscr{B}_2}[T]_{\mathscr{B}_2} \cdot [x]_{\mathscr{B}_2} = [Tx]_{\mathscr{B}_2} &=[I(Tx)]_{\mathscr{B}_2} = {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot [Tx]_{\mathscr{B}_1} \notag \\
&={}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[T]_{\mathscr{B}_1} \cdot [x]_{\mathscr{B}_1} ={}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[T]_{\mathscr{B}_1} \cdot [Ix]_{\mathscr{B}_1} \notag \\
&={}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[T]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2} \cdot [x]_{\mathscr{B}_2}
\end{align}
依次取 \(x=w_1,w_2,\cdots,w_n\),便得出
\begin{align}
{}_{\mathscr{B}_2}[T]_{\mathscr{B}_2} = {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[T]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2}
\end{align}
这个恒等式说明,如果用来计算的基发生变化,\(T\) 的基将如何变化,即是怎么从基 \(\mathscr{B}_1\) 变化到基 \(\mathscr{B}_2\),正是如此,才称矩阵 \({}_{\mathscr{B}_2}[T]_{\mathscr{B}_1}\)\(\mathscr{B}_1 - \mathscr{B}_2\) 基变换矩阵

任一矩阵 \(A \in M_n(\mathbf{F})\)某个线性变换 \(T:V \rightarrow V\) 的一个基表示,这是因为,如果 \(\mathscr{B}\)\(V\) 的任一组基,可以用 \([Tx]_{\mathscr{B}}=A[x]_{\mathscr{B}}\) 来确定 \(Tx\),把 \([Tx]_{\mathscr{B}}\) 展开即可算出,对于这个 \(T\)\({}_{\mathscr{B}}[T]_{\mathscr{B}}=A\).
 


读完应该知道什么

  • 线性变换 \(T\)\(\mathscr{B}_1-\mathscr{B}_2\) 基表示为 \(n\) 维方阵,也称为 \(\mathscr{B}_1 - \mathscr{B}_2\) 基变换矩阵
  • 基变换矩阵只依赖于线性变换 \(T\) 和两组基 \(\mathscr{B}_1,\mathscr{B}_2\)
  • \([Tx]_{\mathscr{B}_2}={}_{\mathscr{B}_2}[T]_{\mathscr{B}_1} \cdot [x]_{\mathscr{B}_1},\forall x \in V\)
  • \({}_{\mathscr{B}_2}[T]_{\mathscr{B}_2} = {}_{\mathscr{B}_2}[I]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[T]_{\mathscr{B}_1} \cdot {}_{\mathscr{B}_1}[I]_{\mathscr{B}_2}\)
  • 任一矩阵 \(A \in M_n(\mathbf{F})\) 是某个线性变换 \(T:V \rightarrow V\) 的一个基表示

 


写在最后的话

文章用的是 Markdown 结合 MathJax 插件,写数学公式时,对一些转义字符冲突的问题。主要是两个:_\\\ 后面跟单词的情况是没问题的,_$ 符号之间也没问题,我遇到主要出现在\begin 内的公式里,如果出现问题,我自己的解决方案:

  • \\ 写成 \\\\ .
  • _ 左边加个\,如果要显示左下标,加上占位符 {}即可。

第一次敲这个,就这么点内容花了将近一天时间哪!如果公式很多的话,还是用 \(\mathrm{\LaTeX}\),然后粘贴图片比较方便。

posted @ 2017-10-14 20:01  小鱼吻水  阅读(1158)  评论(0编辑  收藏  举报