2013年12月6日

GPU/CUDA程序初体验 向量加法

摘要: 现在主要的并行计算设备有两种发展趋势:(1)多核CPU。 双核,四核,八核,。。。,72核,。。。,可以使用OpenMP编译处理方案,就是指导编译器编译为多核并行执行。(2)多线程设备(GP)GPU。 通用GPU,就是显卡,以nvidia公司的显卡为主。nvidia使用CUDA编程。由于毕业的需要,现在开始学习CUDA编程。看了一段时间教程,目前环境已经配好,下面是一个简单的CUDA程序:程序实现向量的加法操作,使用了一个block内部的512个线程。 1 #include 2 #include 3 4 //__global__声明的函数,告诉编译器这段代码交由CPU调用,由GPU执行... 阅读全文

posted @ 2013-12-06 13:58 旭东的博客 阅读(3891) 评论(0) 推荐(1) 编辑

导航