摘要: 搜索对于生成高性能BLAS真的必要吗? 程序优化的一个关键步骤是评估参数的最优值,例如tile sizes和loop unrolling factors(循环展开因子)。传统编译器使用分析模型来计算这些值,而ATLAS库则在参数的取值空间中进行全局搜索,得到不同的取值组合,再在真实硬件上运行,以此决 阅读全文
posted @ 2019-06-19 15:31 happyyoung 阅读(157) 评论(0) 推荐(0) 编辑