[CUDA] 同一个函数根据运行设备选择不同的运行方式
一、简介
有时我们需要在host
和device
端实现同样的一个函数。
一个简单的方法是分别在host
和device
端上实现两个同名函数,例如fun_host()
和fun_device()
,在host
和device
上分别使用不同的函数。
另一种方法只使用一个函数fun()
,在编译时根据运行目标的不同选择使用不同的实现方式。该方法可以使用宏 __CUDA__ARCH__
实现,本文给出了该方法的实现示例。
二、代码示例
main.cu
程序代码:
#include <math.h>
#include <stdio.h>
#include <cuda_runtime.h>
__host__ __device__ inline void fun()
{
#ifdef __CUDA_ARCH__
float a = fdividef(1.0f, 3.0f);
printf("In device, result is %f\n", a);
#else
float a = 1.0f / 3.0f;
printf("In host, result is %f\n", a);
#endif
};
__global__ void f()
{
fun();
}
int main()
{
fun(); // in host
f<<<1, 1>>>(); // in device
cudaDeviceSynchronize();
return 0;
}
CMakeLists.txt
文件内容:
cmake_minimum_required(VERSION 3.0.0)
project(HelloWorld VERSION 0.1.0 LANGUAGES C CXX)
find_package(CUDA REQUIRED)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} --std=c++11")
cuda_add_executable(HelloWorld main.cu)
运行结果:
In host, result is 0.333333
In device, result is 0.333333
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)