会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
随笔 - 26
文章 - 0
评论 - 0
阅读 -
1159
2024年10月6日
高性能计算(1)
摘要: 一、程序优化 CPU程序优化 1.1 体系结构:CPU流水线技术、高速缓指令集、CPU超标量设计 1.2 并行技术:MPI、OpenMP、SIMD、汇编 1.3 算法:算法优化 GPU程序优化 1.1 GPU的体系结构(计算核心、高带宽、多级存储) 1.2 GPU并行框架:CUDA、OpenCL、O
阅读全文
posted @ 2024-10-06 23:24 安洛8
阅读(35)
评论(0)
推荐(0)
编辑
公告
昵称:
安洛8
园龄:
5年5个月
粉丝:
0
关注:
3
+加关注
搜索
最新随笔
1.高性能计算-探究GPU指令延迟隐藏(26)
2.高性能计算-GPU单进程多卡(多流)并行计算编程模型示例(25)
3.高性能计算-CUDA单流/多流调度(24)
4.高性能计算-CUDA矩阵加法及优化测试(23)
5.高性能计算-CUDA一维信号均值滤波及内存优化(22)
6.高性能计算-GPU编程模型(21)
7.高性能计算-Intel IPP库ARM移植示例(20)
8.高性能计算-粒子状态模拟计算-性能优化(19)
9.高性能计算-NEON-图像旋转(18)
10.高性能计算-NEON-intrinsic函数(17)
我的标签
高性能计算
(23)
并行计算
(23)
SIMD
(7)
openmp
(7)
NEON
(7)
GPU
(5)
CUDA
(4)
程序优化
(4)
gemm优化
(3)
CUDA内存模型
(2)
更多
随笔分类
高性能计算(26)
随笔档案
2025年3月(1)
2025年2月(1)
2025年1月(2)
2024年12月(7)
2024年11月(8)
2024年10月(7)
阅读排行榜
1. 高性能计算-bgra2rgb转换-向量化优化(15)(118)
2. 高性能计算-gemm-mpi并行计算优化(8)(103)
3. 高性能计算-Intel IPP库ARM移植示例(20)(88)
4. 高性能计算-gemv-向量化优化(16)(85)
5. 高性能计算-openmp-多线程缓存一致性(9)(74)
点击右上角即可分享