爨爨爨好

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年10月24日

摘要: ▶ CUDA 动态并行实现快排算法(单线程的递归调用) ▶ 源代码:动态并行递归调用线程块。要点:添加 -rdc=true 选项(生成 relocatable device code,相当于执行分离编译),以及链接库 cudadevrt.lib (用于动态并行,不同于运行时库 cudart.lib) 阅读全文
posted @ 2017-10-24 23:23 爨爨爨好 阅读(553) 评论(0) 推荐(0) 编辑

摘要: ▶ CPU - GPU 异步操作 ▶ 源代码 ● 输出结果: ▶ 新姿势: ● 调用主函数时的第0个参数作为程序名字符串,可以用于输出。 ● 在没有附加 flag 的情况下申请主机内存,注意使用cudaFreeHost释放 ● 记录 CPU 调用 CUDA 所用的时间 ● 查看GPU队列状态的函数 阅读全文
posted @ 2017-10-24 14:56 爨爨爨好 阅读(269) 评论(0) 推荐(0) 编辑