2022-2023 春学期 矩阵与数值分析 C1 绪论

2022-2023 春学期 矩阵与数值分析 C1 绪论

原文

封面

img

引言

本文内容来自于对矩阵与数值分析课程资料的整理;

本文所涉及的课程指东北某沿海高校,计算机学院硕士生必修课“矩阵与数值分析”,课程资料包括课程PPT、教材《计算机科学计算 第二版》[1],以及网络资料,师兄的笔记等。

C1 绪论

1.1 计算机科学计算研究对象与特点

该部分介绍了计算机科学计算研究对象与特点;

image-20230309102746434

1.2 误差分析与数值方法的稳定性

误差的来源与分类

image-20230309102922186

image-20230309102939864

image-20230309102959261

误差基本概念与有效数字

相对与绝对误差:
  • 绝对误差:设 x 为精确值,a 为 x 的一个近似值,称 x-a 为近似值 a 的绝对误差,简称误差。误差 x-a 可正可负。通常准确值 x 是未知的,因此 x-a 也是未知的。
  • 绝对误差界:设 x 为精确值,a 为 x 的一个近似值,若有常数 \(e_a\) 使得 \(|x-a|\leq e_a\) ,则 \(e_a\) 叫做近似值 a 的误差界(限)。它总是正数。显然有 \(a-e_a\leq x\leq a+e_a\)
  • 相对误差:若 \(x\neq0\),则将近似值的误差与准确值的比值\(\frac{x-a}{x}\) 称为近似值 a 的相对误差。相对误差也可正可负。实际计算中,如果真值 x 未知时,通常取 $ \frac{x-a}{x} \approx \frac{x-a}{a}$ 作为 a 的相对误差,条件是 \(\frac{x-a}{x}\) 较小。
  • 相对误差界(限):相对误差的绝对值上限叫做相对误差界(限),记为 \(\frac{x-a}{a}\leq\frac{e_a}{|a|}\)

误差界的取法:当准确值 x 的位置比较多时,人们常常按照四舍五入的原则得到 x 的前几位近似值 a。

* 例如:

\(x = \pi = 3.1415926\cdots\)

取3位:\(a_1 = 3.14, \pi-a_1=0.00159265\cdots\)

取5位:\(a_2 = 3.1416,\pi-a_2=-0.00000735\cdots\)

那么它们的误差界的取法应为:

\(|\pi-3.14|\leq\frac{1}{2}\times 10^{-2},\ |\pi-3.1416|\leq\frac{1}{2}\times10^{-4}\)

有效数字相关

定义:设 x 为精确值,a 为 x 的一个近似值 ,a 由 n 位数组成,自左向右第 i 位为\(a_i\),是 0 到 9 之中的一个数字,且\(i\geq1,\ a_1\neq 0\),表示为: \(a = \pm 10^k\times0.a_1a_2\cdots a_n\cdots\),其中,n 为正整数,k 为整数,如果其绝对误差界 \(|x-a|\leq\frac{1}{2}\times 10^{k-n}\),则称 a 为 x 的具有 n 位有效数字的近似值

有关结论:

  • 有效数字位数与小数点的位置无关
  • 一般来说,绝对误差与小数位数有关,相对误差与有效数字位数有关
  • 如果一个近似值是由精确值四舍五入得到的,那么,从这个近似值的末尾数向前数起直至在五非零数字位置,所属到的数字均为有效数字

求有效数字位数的步骤:首先将近似值表示为定义中 a 的形式,可以得到 k,接下来一句上述定义计算绝对误差界,得到 k-n ,最后即可依据上述数据得到有效数字位数 n 。

* 例如1:

对于 $ e = 2.71828182\cdots$,下面各个值的有效数字的位数。

\(a=2.718 = 10^1\times 0.2718,\ k=1\)

其绝对误差界为 \(|e-a|<0.0003<\frac{1}{2}\times10^{-3},\ k-n=-3,\ n=4\)

\(a\)\(e\) 的具有4位有效数字的近似值。

\(a_1=2.7182 = 10^1\times 0.27182,\ k=1\)

其绝对误差界为 \(|e-a_1|<0.00009<\frac{1}{2}\times10^{-3},\ k-n=-3,\ n=4\)

\(a_1\)\(e\) 的具有4位有效数字的近似值。

* 例如2:

下列近似值的绝对误差界均为 0.005,问其有效数字的位数。

\(a=138.00,\ b=-0.0312,\ c=0.86\times 10 ^{-4}\)

对于\(a\), \(|x-a|<\frac{1}{2}\times10^{-2},\ k-n=-2\),且 \(a=138.00=0.138\times10^3, k=3,\ n=5\),a 具有5位有效数字。

对于\(b\), \(|x-b|<\frac{1}{2}\times10^{-2},\ k-n=-2\),且 \(b=-0.0312=-0.312\times10^{-1}, k=-1,\ n=1\),b 具有1位有效数字。

对于\(c\), \(|x-c|<\frac{1}{2}\times10^{-2},\ k-n=-2\),且 \(c=0.86\times 10^{-4}, k=-4,\ n=-2\),不满足 \(n\) 为正整数的条件,故 c 具有0位有效数字。

有效数字与相对误差界

关于有效数字与相对误差界有如下定理:

若实数 x 为某个精确值, a 为它的一个近似值,其表达式形式如

\(a=\pm10^k\times0.a_1a_2\cdots a_n\cdots\)

  • 如果 a 有 n 位有效数字,则其相对误差满足 \(\frac{|x-a|}{|a|}\leq\frac{1}{2a_1}\times10^{1-n}\).
  • 如果其相对误差满足 \(\frac{|x-a|}{|a|}\leq\frac{1}{2(a_1+1)}\times10^{1-n}\),则 a 至少有 n 位有效数字。

其推导过程如下所示:

有效数字与相对误差界的关系

函数计算的误差估计

针对一元函数:

思路:使用 Taylor 展开计算解决这一问题,例如将 f(x) 在 x=a 展开:

$ f(x)=f(a)+f(a)'(x-a) + \frac{f''(\xi)(x-a)}{2}$

$ |f(x)-f(a)|\leq|f'(a)||x-a|+\frac{|f''(xi)||(x-a)|^2}{2}$

由上式可得,

近似绝对误差估计式为:\(|f(x)-f(a)|\approx|f'(a)||x-a|\)

近似相对误差界为:\(\frac{|f(x)-f(a)|}{|f(a)}\leq\frac{f'(a)}{f(a)}|x-a|\)

* 例如1

计算 \(\sqrt{a}\) 的相对误差界

解: 相对误差界为

\(\frac{\sqrt{x}-\sqrt{a}}{\sqrt{a}}\leq\frac{(\sqrt{x})'|_{x=a}}{\sqrt{a}}|x-a|=\frac{1}{2(\sqrt{a})^2}|x-a|=\frac{1}{2}\frac{|x-a|}{|a|}\)

可知,\(\sqrt{a}\) 的相对误差为 \(a\) 的相对误差的一半

类似的,针对多变元的情况,

如果 \(f(x_1,x_2,\cdots,x_n)\)\(n\) 元函数,自变量 \(x_1,x_2,\cdots,x_n\) 的近似值为 \(a_1,a_2,\cdots,a_n\)

\(f(x_1,x_2,\cdots,x_n)-f(a_1,a_2,\cdots,a_n)\approx\sum^n_{k=1}(\frac{\partial f}{\partial x_k})_a(x_k-a_k)\)

的函数值的误差界 \(|f(x_1,x_2,\cdots,x_n)-f(a_1,a_2,\cdots,a_n)|\approx\sum^n_{k=1}|(\frac{\partial f}{\partial x_k})_a||x_k-a_k|\)

* 例如2

可利用上述定义计算四则运算的误差估计

\(|f(x_1,x_2)-f(a_1,a_2)|\leq|(\frac{\partial f}{\partial x_1})_{a}|\cdot |x_a-a_1|+|(\frac{\partial f}{\partial x_2})_{a}|\cdot |x_2-a_2|\)

针对加减法 \(f(x_1,x_2)=x_1\pm x_2\), 有 $ |(x_1\pm x_2)-(a_1\pm a_2)|\leq|x_1-a_1|+|x_2-a_2|$

可知:两个近似数相加减,其运算结果的精度不必原始数据的任何一个精度高。

注意:在计算中应避免两个相近的数相减,否则容易导致有效数字的损失

针对乘法 \(f(x_1,x_2)=x_1\cdot x_2\),有 \(|x_1x_2-a_1a_2|\leq |a_2||x_1-a_1|+|a_1||x_2-a_2|\)

针对除法 \(f(x_1,x_2)=\frac{x_1}{x_2}\),有 \(|\frac{x_1}{x_2}-\frac{a_1}{a_2}|\leq\frac{|x_1-a_1|}{|a_2|}+\frac{|a_1||x_2-a_2|}{|a_2|^2}\leq\frac{|a_2||x_1-a_1|+|a_1||x_2-a_2|}{|a_2|^2}\)

可知,计算中应尽力避免小数作除数

数值方法数值稳定性

定义:

用某一种数值方法求一个问题的数值解,如果在方法的计算过程中舍入误差在一定条件下能够得到控制(或者说舍入误差增长不影响产生可靠的结果),则称该方法是数值稳定的;出现与数值稳定相反的情况,则称之为数值不稳定的。(蝴蝶效应?)

* 例如:

数值稳定性1

数值稳定性

稳定性数值

可见,两种方法计算得到的误差是有显著区别的。方法一每次都会使误差放大5倍;方法二每次都会使误差缩小为原来的 \(\frac{1}{5}\)。递推计算多次后就会有相当大的差别。而事实上方法一符合通常的思路,因为方法一的起点是已知的;而方法二的起点是未知的,计算难以开始。

一种可能的思路是,由积分中值定理可知,显然积分的结果在 0-1 之间,那不妨假设 \(I_{15}=\frac{1}{2}\),并以此利用方法二反推得到 \(I_7\),这样最后递推计算 8 次后,误差被缩小为原来的 \((\frac{1}{5})^8\),这对于 0-1 之间的结果来说是可以接受的,或者可以取大于 15 的数字开始递推更多次,使得误差被进一步缩小。

避免误差危害的基本原则
  1. 避免有效数字的损失
  • 避免计算机上出现的”大数吃小数“

例如:

大数吃小数

  • 利用求根公式求解一元二次方程时,若 b 远大于 ac 的积,则 \(\sqrt{b^2-4ac}\approx|b|\),分母中的 $-b\pm\sqrt{b^2-4ac}\approx0 $, 出现了两相近的数相减的情况。

其例子与解决方法如下:

Q54E8H2SPT8Q2R6C

N59MKS

EXTZE

  • 避免小数作除法或大数作乘数
  1. 减少运算次数
  • 使用秦九韶算法

例如求 \(p_n(x)=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0\) 的值,可通过如下过程:

\(\begin{aligned}p_n(x)&=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0\\&=(a_nx+a_{n-1})x^{n-1}+\cdots+a_1x+a_0\\&=((a_nx+a_{n-1})x+a_{n-2})x^{n-2}+a_{n-3}x^{n-3}+\cdots a_1x+a_0\\&=\cdots=\\&=((\cdots((a_nx+a_{n-1})x+a_{n-2})x+\cdots+a_{2})x+a_1)x+a_0\end{aligned}\)

相较于直接逐项求和计算需要的 \(2n-1\) 次乘法,使用秦九韶算法后,仅需要计算总共 \(n\) 次乘法即可得到所需的结果。

例如:\(P_5(x)=5x^5+x^3-3x^2+x-1\)

\(\begin{aligned}P_5(x)&=5x^5+x^3-3x^2+x-1\\&=5x^5+0x^4+1x^3-3x^2+x-1\\&=((((5x+0)x+1)x-3)x+1)x-1\end{aligned}\)

  • 使用泰勒展开

image-20230308204359988

1.3 向量与矩阵范数

范数的概念是复数模的概念的自然推广

向量范数

条件

对任意向量 \(x\)\(y\) 及复数 \(a\in C\)\(f(x)=||x||\)函数满足以下三个条件:

  1. 非负性

    \(||x||\geq0,\ ||x||=0 \Leftrightarrow x=0_{n\times1}\)

  2. 齐次性

    \(||ax||=|a|\cdot||x||\)

  3. 三角不等式

    \(||x+y||\leq||x||+||y||\)

称函数 \(||*||\) 为 上的一个向量范数,是连续函数

常用的向量范数

p-范数

\(||x||_p=(\sum^n_{i=1}|x_i|^p)^{1/p},\ 1\leq p<+\infty\)

特别的,

\(p=1,\ ||x||_1=(\sum^n_{i=1}|x_i|)\)\(|x_i|\) 表示 \(x_i\) 的模

\(p=2,\ ||x||_2=(\sum^n_{i=1}|x_i|^2)^{1/2}=\sqrt{x^Hx}=\sqrt{(x,x)}\),其中 \(x^H\) 表示 向量\(x\) 的共轭转置

\(p=+\infty,\ ||x||_\infty=\max_\limits{ 1\leq i\leq n}|x_i|\)

向量加权范数

image-20230308214829897

* 例如

image-20230308214854887

等价性定理:

\(||\cdot||_\beta\)\(||\cdot||_\alpha\)\(C^n\) 上的任意两种向量范数,则存在两个与向量无关的正常数 \(c_1>0,\ c_2>0\),使得 \(c_1||x||_\beta\leq||x||_\alpha\leq c_2||x||_\beta\),并称 \(||\cdot||_\beta\)\(||\cdot||_\alpha\)\(C^n\) 上的等价范数。

这一定理指出了尽管不同范数的值不一定相同,但都可以对向量进行度量。

特别的,

\(||x||_\infty\leq||x||_1\leq n||x||_\infty\)

\(\frac{1}{\sqrt{n}}||x||_1\leq||x||_2\leq||x||_1\)

\(\frac{1}{\sqrt{n}}||x||_2\leq||x||_\infty\leq||x||_2\)

或者

\(||x||_\infty\leq||x||_2\leq||x||_1\leq\sqrt{n}||x||_2\leq n||x||_\infty\)

矩阵范数 (m, F)

矩阵可以看(拉)做一个向量,可以把向量范数的概念直接推广到矩阵上

条件

对任意矩阵 \(A\)\(B\) 及复数 \(a\in C\) ,函数 \(f(A)=||A||\) 满足以下个条件:

  1. 非负性

    \(||A||\geq0,\ ||A||=0\Leftrightarrow A=0\)

  2. 齐次性

    \(||\alpha A||=|\alpha|\cdot||A||\)

  3. 三角不等式

    \(||A+B||\leq||A||+||B||\)

  4. 相容性

    相比于向量范数,矩阵范数应考虑到矩阵乘法。

    对任意矩阵 \(A\in C^{m\times l}\)\(B\in C^{l\times n}\),满足 \(||AB||_{M1}\leq||A||_{M2}\cdot||B||_{M3}\)

满足非负性、齐次性、三角不等式、相容性的函数 \(||\ \ ||\) 称为矩阵范数

对于矩阵 \(A_{m\times n}\),常见的矩阵范数有:
  • \(m_1\) 范数,\(||A||_{m_1}=\sum^m_{i=1}\sum^n_{j=1}|a_{ij}|\)

  • \(F\) 范数,\(||A||_F=(\sum^m_{i=1}\sum^n_{j=1}|a_{ij}|^2)^{1/2}\)

  • \(m_\infty\) 范数,\(||A||_{m_\infty}=\sqrt{m\cdot n}\cdot\max\limits_{ij}|a_{ij}|\)

    注意 \(||A||_{m‘_\infty}=\max\limits_{ij}|a_{ij}|\) 不构成 \(A\) 的范数,理由如下图所示:

    image-20230308222556647

矩阵范数的等价性定理:设 \(||\cdot||_\beta\)\(||\cdot||_\alpha\)\(C^{n\times n}\) 上的任意两种矩阵范数,则存在两个与矩阵无关的正常数 \(c_1>0,\ c_2>0\),使得 \(c_1||A||_\beta\leq||A||_\alpha\leq c_2||A||_\beta\),并称 \(||\cdot||_\beta\)\(||\cdot||_\alpha\)\(C^{n\times n}\) 上的等价范数。

矩阵范数的性质

定义:

​ 称集合 \(\sigma(A)=\{\lambda|\det(\lambda I-A)=0\}\) 为矩阵 \(A\in C^{n\times n}\) 的谱;也就是 \(A\) 的所有的特征值全体;

​ 称实数 \(\rho(A)=\max|\lambda|\) 为矩阵 \(A\in C^{n\times n}\) 的谱半径;也就是 \(A\) 的绝对值最大的特征值;谱半径不是矩阵的范数。

image-20230309142220167

三个重要定理

定理1:设 \(||\ \cdot\ ||_M\) 为矩阵 \(C^{n\times n}\) 空间的任一矩阵范数,则对任意的 \(n\) 阶方阵 \(A\) 均有 \(\rho(A)\leq||A||_M\),其中 \(\rho(A)\leq||A||_M\)\(A\) 方阵的谱半径

证明:

image-20230309142137773

定理2:对于任给的 \(\varepsilon>0\) ,则存在 \(C^{n\times n}\) 上的一种算子范数 \(||\ \ ||_M\) (依赖矩阵 \(A\) 和常数 \(\varepsilon\)),使得 \(||A||_M\leq\rho(A)+\varepsilon\);

注意:对另一矩阵 \(B\),不等式不一定成立

定理3: 设 \(A\in C^{n\times n}\) ,如果有 \(C^{n\times n}\) 上的一种矩阵范数 \(||\cdot||\),使得 \(||A||<1\)

(1)$ I\pm A$ 可逆;

(2)\(||(I\pm A)^{-1}||\leq\frac{||I||}{1-||A||}\)

(3)\(||I-(I\pm A)^{-1}||\leq\frac{||A||}{1-||A||}\)

注:如果 \(\lambda_i,\ i=1,2,\cdots,n\) 是矩阵 \(A\) 的特征值,则矩阵 \(I\pm A\) 的特征值为 \(\mu_i=1\pm\lambda_i,\ i=1,2,\cdots,n\)

证明:

K{QOJHX~V3L3QA32VLLW0W6

fjsfhskfha

算子范数

由于矩阵与向量的乘积在矩阵计算中经常出现,所以希望矩阵范数与向量范数之间最好有某种协调性

相容性

矩阵范数与向量范数的相容性的定义: 对矩阵范数 \(||\ \ ||_M\) 与向量范数 \(||\ \ ||_V\),有 \(||Ax||_V\leq||A||_M||x||_V\)

显然,不是任意的矩阵范数与任意的向量范数相容。

结论:

  • 矩阵 m1-范数与向量 p-范数相容,即 \(||Ax||_P\leq ||A||_{m1}||x||_p\)
  • 矩阵 F-范数与向量 2-范数相容,即 \(||Ax||_2\leq||A||_F||x||_2\)
  • 对任一矩阵范数均存在与之相容的向量范数

定理1.4(算子范数定义):已知 \(C^m\)\(C^n\) 上的同类向量范数 \(||\cdot||_V\)\(A\)\(m\times n\) 矩阵,定义 \(||A||_M=\max\limits_{x\neq0}\frac{||Ax||_V}{||x||_V}=\max\limits_{||x||_V=1}||Ax||_V\),则 \(||A||_M\) 是一种矩阵范数,且与已知的向量范数相容。

对于矩阵 \(A_{m\times n}\),常用的算子范数有
  • 列和范数:\(||A||_1=\max\limits_{1\leq j\leq n}\sum_{i=1}^m|a_{ij|}\)

  • 行和范数:\(||A||_\infty=\max\limits_{1\leq i\leq m}\sum^n_{j=1}||a_{ij}||\)

  • 谱范数:\(||A||_2=\sqrt{\lambda_\max(A^HA)}=\sqrt{\rho(A^HA)}\),(谱半径开根号)

    可以证明:\(||A||^2_2\leq||A||_1||A||_\infty\)

其中 \(\lambda_\max(A^HA)\) 表示矩阵 \(A^HA\) 的最大特征值;(或 \(\sqrt{\rho(A^HA)}\)

特别的,\(||A||_{m_1}\)\(||A||_F\) 不是算子范数

(下标带 m、F 的是矩阵范数,其他的是矩阵范数中的算子范数?)

* 例如1

针对单位矩阵

image-20230309101032969

* 例如2

image-20230309101052080

*酉矩阵的范数不变性

对于酉矩阵 \(U,\ U^HU=UU^H=I\),(该矩阵与其共轭转置的乘积为单位矩阵),

\(||U||_2=1,\ ||AU||_2=||UA||_2=||A||_2\)

推导过程如下:

image-20230309101726967

*F-范数的酉不变性

\(A\)\(n\) 阶方阵,则存在 \(n\) 阶酉阵 \(U\)\(V\), 使得 \(||UA||_F=||AV||_F=||UAV||_F=||A||_F\)

推导过程如下:

image-20230309102210904

其他的结论

image-20230309103127762

image-20230309103146264


  1. 《计算机科学计算 第二版》 作者: 张宏伟 金光日 施吉林;出版社: 高等教育出版社;页数: 379;定价: 38.1元;装帧: 平装-胶订;ISBN: 9787040365955 出版年:2013;学科主题: 电子计算机 教材 科学计算-高等学校;中图法分类号: TP301.6; 一般附注: 高等学校教材 ↩︎

posted @ 2023-03-10 19:38  owuiviuwo  阅读(36)  评论(0编辑  收藏  举报