2023-06-30《计算方法》- 陈丽娟 - 线性方程组的迭代解法.md
2023-06-30《计算方法》- 陈丽娟 - 线性方程组的迭代解法
所谓迭代法实际上是求解一个关于映射的不动点问题:

然后利用


这里


定义1
设







定理1
序列依坐标收敛(依范数收敛)于
的充分条件是

1. 雅可比迭代法
对于非奇异线性方程组

令

其中





则有

给定


注意上式很容易可以写出个分量的迭代格式:

2. 高斯-赛德尔迭代
在雅可比迭代中,如果先被计算出来,则我们可以将分量
替换
带入到
的计算中,即是

其矩阵形式为

即是

3. Jacobi和G-S迭代的统一框架
矩阵分裂
设非奇异,称

为


对于

经过矩阵分裂可得

移项可得

由上可知雅可比迭代就是取,
, 而G-S迭代是取
,
, 因此都可称为矩阵分裂迭代法。
4. 其他矩阵分裂迭代法
4-1. SOR 迭代法(Successive Overrelaxation)
为了加速迭代的收敛,SOR方法将G-S迭代中与
做一个凸组合作为下一步迭代的值,即是

上式整理之后可得

同样可以得到对应的

迭代格式为

其中不同取值时:
- 当
时,即是G-S迭代法;
- 当
时,称为低松弛方法;
- 当
时,称为超松弛方法(大部分情况下超松弛更好)。
注意到一开始SOR方法实际上是一个MANN迭代(),但是MANN迭代需要
等条件,且MANN迭代的提出并非是为了加快收敛速度,而是为了解决Picard迭代在非扩张映射下不一定收敛而提出的。
4-2. SSOR 迭代法
将 SOR 方法中的 和
相互交换位置, 则可得迭代格式

结合上式和SOR则得到SSOR(对称超松弛迭代法)

注
对于某些特殊问题, SOR 方法不收敛, 但仍然可能构造出收敛的 SSOR 方法.
一般来说, SOR 方法的渐进收敛速度对参数比较敏感, 但 SSOR 对参数
不是很敏感.
5. 收敛性分析
从不动点理论的角度来看,上述所有的迭代格式都可以看作是, 其中
, 即所有的迭代都是Picard迭代,那么根据Banach不动点定理,我们知道当
是压缩映射时(
即
),序列
收敛到
的不动点,也就是线性方程组的解。
下面根据华东师范大学潘建瑜老师《矩阵计算讲义》列出矩阵下的收敛性分析,我们可以看到虽然描述的方式不一样,但是和不动点理论的结果却是相似的。
矩阵序列的收敛
设是
中的一个矩阵序列。如果存在矩阵
使得

则称





定理
设矩阵,则
当且仅当
.
证明:
设,则存在矩阵范数
使得
。因此
必要性:由即可得。
定理
设, 则对任意矩阵范数
, 有

收敛速度
设点列收敛,且
. 若存在一个有界常数
, 使得

则称点列




收敛性定理
对任意迭代初始向量, 矩阵分裂迭代法收敛充要条件是
.
定义
设是迭代矩阵,则矩阵分裂迭代法的平均收敛速度定义为

渐进收敛速度定义为

定理
考虑矩阵分裂迭代法,如果存在某个算子范数使得
,则
6. 各迭代法之间的数值比较
下面给出的算法包含求逆运算,用行迭代是否可以加速计算有待深入。
Jacobi迭代法
- function [x0, xlog] = JacobiLE(x0, A, b, epsilon, maxit)
- if(nargin < 5)
- maxit = 1e3;
- end
- iter = 1;
- xlog = zeros(maxit,1);
- errors = norm(A*x0 - b);
- D = diag(diag(A));
- LU = D - A;
- D = inv(D);
- G = D * LU;
- F = D * b;
- while iter <= maxit && errors >= epsilon
- %x1 = G * x0 + F;
- x1 = x0 + D * (b - A*x0);
- errors = norm(A * x1 - b);
- xlog(iter) = errors;
- x0 = x1;
- iter = iter + 1;
- end
- xlog = xlog(1:(iter-1));
- end
G-S迭代法
- function [x0, xlog] = GSLE(x0, A, b, epsilon, maxit)
- if(nargin < 5)
- maxit = 1e3;
- end
- iter = 1;
- xlog = zeros(maxit,1);
- errors = norm(A*x0 - b);
- D = diag(diag(A));
- L = D - tril(A);
- U = D - triu(A);
- DL = inv(D-L);
- G = DL * U;
- F = DL * b;
- while iter <= maxit && errors >= epsilon
- x1 = G * x0 + F;
- %x1 = x0 + D * (b - A*x0);
- errors = norm(A * x1 - b);
- xlog(iter) = errors;
- x0 = x1;
- iter = iter + 1;
- end
- xlog = xlog(1:(iter-1));
- end
SOR迭代法
- function [x0, xlog] = SOR(x0, A, b, omega, epsilon, maxit)
- if(nargin < 6)
- maxit = 1e3;
- end
- iter = 1;
- xlog = zeros(maxit,1);
- errors = norm(A*x0 - b);
- D = diag(diag(A));
- L = D - tril(A);
- U = D - triu(A);
- DL = inv(D-omega *L);
- G = DL * ((1-omega)*D+omega*U);
- F = omega * DL * b;
- while iter <= maxit && errors >= epsilon
- x1 = G * x0 + F;
- %x1 = x0 + D * (b - A*x0);
- errors = norm(A * x1 - b);
- xlog(iter) = errors;
- x0 = x1;
- iter = iter + 1;
- end
- xlog = xlog(1:(iter-1));
- end
SSOR迭代法
- function [x0, xlog] = SSOR(x0, A, b, omega, epsilon, maxit)
- if(nargin < 6)
- maxit = 1e3;
- end
- iter = 1;
- xlog = zeros(maxit,1);
- errors = norm(A*x0 - b);
- D = diag(diag(A));
- L = D - tril(A);
- U = D - triu(A);
- DL = inv(D-omega*L);
- DU = inv(D-omega*U);
- GL = DL * ((1-omega)*D+omega*U);
- GU = DU * ((1-omega)*D+omega*L);
- FL = omega * DL * b;
- FU = omega * DU * b;
- while iter <= maxit && errors >= epsilon
- x1 = GL * x0 + FL;
- x1 = GU * x1 + FU;
- %x1 = x0 + D * (b - A*x0);
- errors = norm(A * x1 - b);
- xlog(iter) = errors;
- x0 = x1;
- iter = iter + 1;
- end
- xlog = xlog(1:(iter-1));
- end
下面给出例子
- clear
- n = 1000;
- x0 = rand(n,1);
- A = rand(n,n)*10;
- A = A + diag(sum(A,2));
- max(abs(eig(A))); %谱半径
- b = rand(n,1);
- epsilon = 1e-6;
- maxit = 1e3;
- [JacpbiX, JacobiXlog] = JacobiLE(x0, A, b, epsilon, maxit);
- plot(log10(JacobiXlog))
- xlim([0 100])
- hold on
- [GSS, GSSlog] = GSLE(x0, A, b, epsilon, maxit);
- plot(log10(GSSlog))
- hold on
- omega = 1.5;
- [SORX, SORXlog] = SOR(x0, A, b, omega, epsilon, maxit);
- plot(log10(SORXlog))
- hold on
- omega = 1.5;
- [SSORX, SSORXlog] = SSOR(x0, A, b, omega, epsilon, maxit);
- plot(log10(SSORXlog))
- legend(["Jacobi" "G-S" "SOR" "SSOR"])
结果如下所示
随机产生的矩阵很有可能在迭代过程中导致迭代发散,因此这里将随机矩阵改成了严格行对角占优矩阵,相关补充如下。
定义
设, 则有:
- 如果
的元素满足
, 则称
为严格(行)对角占优矩阵。(相应的可以定义列对角占优矩阵)
- 如果
的元素满足
, 且至少对一个
不等式严格成立,则称
为弱对角占优矩阵
定义
设,如果存在置换矩阵
, 使得

其中




定理
设,如果
为严格对角占优矩阵,或
为弱对角占优矩阵且
是不可约矩阵,则Jacobi和G-S迭代均收敛。
7. 待研究情况
- 除了定理所示情况,还有哪些矩阵能使迭代收敛。
- 不可约矩阵的判定方法。
- 最佳的松弛因子。
- 加速的、或更广泛的迭代算法。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律