SMAT 当中的底层硬件优化方法
SMAT shows big advantages in performance due to
1.SIMDization
2.branch optimization
3.data prefetch
4.task parallelism policy
一 SIMD
是一种空间并行策略。
Single Instruction Multiple Data。
联想一下机器学习当中的神经网络,是不是当有多个输入的时候,输入被连接成为矩阵的形式。然后在这个矩阵上面,不同列的数据之间的计算都是独立的?就是这样的一个空间并行,通过增加硬件资源来提高计算性能。
SIMD也常常是用于CPU当中的向量处理模块的计算。