会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
随笔 - 26
文章 - 0
评论 - 0
阅读 -
1159
2024年10月13日
高性能计算-循环优化(2)
摘要: 一、Loop循环优化有以下几种 循环合并:两个循环合并到一个循环中 循环展开:循环内的并行技术 循环交换:改变多维数组的空间访问顺序,改善空间局部性,提高cache命中率 循环分布:将一个循环拆分为多个循环,使编译器可以进行向量化优化 循环不变:循环中不发生变化的量提到循环外面,避免重复计算 循环分
阅读全文
posted @ 2024-10-13 17:58 安洛8
阅读(35)
评论(0)
推荐(0)
编辑
公告
昵称:
安洛8
园龄:
5年5个月
粉丝:
0
关注:
3
+加关注
搜索
最新随笔
1.高性能计算-探究GPU指令延迟隐藏(26)
2.高性能计算-GPU单进程多卡(多流)并行计算编程模型示例(25)
3.高性能计算-CUDA单流/多流调度(24)
4.高性能计算-CUDA矩阵加法及优化测试(23)
5.高性能计算-CUDA一维信号均值滤波及内存优化(22)
6.高性能计算-GPU编程模型(21)
7.高性能计算-Intel IPP库ARM移植示例(20)
8.高性能计算-粒子状态模拟计算-性能优化(19)
9.高性能计算-NEON-图像旋转(18)
10.高性能计算-NEON-intrinsic函数(17)
我的标签
高性能计算
(23)
并行计算
(23)
SIMD
(7)
openmp
(7)
NEON
(7)
GPU
(5)
CUDA
(4)
程序优化
(4)
gemm优化
(3)
CUDA内存模型
(2)
更多
随笔分类
高性能计算(26)
随笔档案
2025年3月(1)
2025年2月(1)
2025年1月(2)
2024年12月(7)
2024年11月(8)
2024年10月(7)
阅读排行榜
1. 高性能计算-bgra2rgb转换-向量化优化(15)(118)
2. 高性能计算-gemm-mpi并行计算优化(8)(103)
3. 高性能计算-Intel IPP库ARM移植示例(20)(88)
4. 高性能计算-gemv-向量化优化(16)(85)
5. 高性能计算-openmp-多线程缓存一致性(9)(74)
点击右上角即可分享