循环交换(一)——基本概念
交换紧嵌套中两个循环的嵌套顺序(提高程序性能最有效的变换之一)。例如:
1
Do I = 1,N
2
Do J = 1,M
3
A(I,J+1) = A(I,J) + B
4
ENDDO
5
ENDDO
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
2
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
3
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
4
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
5
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
此例子中最内层语句3存在内层循环携带依赖。无法按向量代码生成算法codegen作向量化。
但是交换这两层循环,如
1
Do J = 1,M
2
Do I = 1,N
3
A(I,J+1) = A(I,J) + B
4
ENDDO
5
ENDDO
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
2
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
3
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
4
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
5
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
依赖关系变成外层循环,而内层循环不携带依赖。因此,内层循环可以被向量化为:
1
Do J = 1,M
2
A(1:N,J+1) = A(1:N,J) + B
3
ENDDO
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
2
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
3
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
如果把此过程颠倒过来,变成内层并行循环移动到最外层以增加并行粒度和减少同步开销。
结论:循环变换实际上是一种重排序交换,可以把循环看成所包含语句的一系列参数化实例。循环变换就是改变这些参数化实例的执行顺序,但并没有产生任何新的实例。
在以下的代码中令S(I,J)表示参数为I,J的语句S的实例。换句话说,S(I,J)是语句S在迭代向量为(I,J)的迭代中执行时的实例。
1
DO J = 1,M
2
DO I = 1,N
3
S
4
ENDDO
5
ENDDO
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
2
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
3
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
4
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
5
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
使用这种记法,在此代码中S(1,2)在S(2,1)之后执行,但是在循环变换后,它变成在S(2,1)之前执行。
循环变换实际上是重排序变换。因为是重排序变换,故其合法性可以通过数据依赖关系判定。