摘要: 1. 目标:分析循环分块优化技术,并分析cache 命中情况 假设每个cacheline可以存储b个数据元素。 2. 源代码分析 for( int i=0;i<N;i++) { for(int j=0;j<M;j++) { A[i] += B[j]; } } cache miss分析: 对A总访问次 阅读全文
posted @ 2024-11-24 16:06 安洛8 阅读(53) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示