随笔分类 -  GPU/CUDA

GPGPU OpenCL/CUDA 高性能编程的10大注意事项
摘要:1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开代码例子: 1 #include 2 using namespace std; 3 4 int main(){ 5 int sum=0; 6 for(int i=1;i2 int main()3 {4 int a=SIZE;5 printf("a=%d, SIZE=%d\n",a,SIZE);6 return 0;7 }View Code 编译: g++ -DSIZE=128 -o A Dmacro.cpp4... 阅读全文

posted @ 2014-03-30 21:24 旭东的博客 阅读(9918) 评论(1) 推荐(1) 编辑

CUDA使用Event进行程序计时
摘要:GPGPU是众核设备,包含大量的计算单元,实现超高速的并行。使用CUDA在nvidia显卡上面编程时,可以使用CUDA提供的Event进行程序计时。当然,每种编程语言基本都提供了获取系统时间的函数,如C/C++/Java 程序计时功能函数Event可以统计GPU上面某一个任务或者代码段的精确运行时间。如下面的程序实例(CalTime.cu): 1 #include 2 #include 3 4 //__global__声明的函数,告诉编译器这段代码交由CPU调用,由GPU执行 5 __global__ void mul(int *dev_a,const int NUM) 6 { 7 ... 阅读全文

posted @ 2014-03-01 09:27 旭东的博客 阅读(15357) 评论(3) 推荐(0) 编辑

GPU/CUDA程序初体验 向量加法
摘要:现在主要的并行计算设备有两种发展趋势:(1)多核CPU。 双核,四核,八核,。。。,72核,。。。,可以使用OpenMP编译处理方案,就是指导编译器编译为多核并行执行。(2)多线程设备(GP)GPU。 通用GPU,就是显卡,以nvidia公司的显卡为主。nvidia使用CUDA编程。由于毕业的需要,现在开始学习CUDA编程。看了一段时间教程,目前环境已经配好,下面是一个简单的CUDA程序:程序实现向量的加法操作,使用了一个block内部的512个线程。 1 #include 2 #include 3 4 //__global__声明的函数,告诉编译器这段代码交由CPU调用,由GPU执行... 阅读全文

posted @ 2013-12-06 13:58 旭东的博客 阅读(3901) 评论(0) 推荐(1) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示