摘要:
CUDA Fortran的优化准则 前言 本文内容出自《GPU并行算法--N-S方程高性能计算》(白智勇,李志辉 著),摘自chapter 6,有少许精简,但不影响整体逻辑。 CUDA Fortran作为标准Fortran的一种扩展,CUDA Fortran程序的编写应该遵循Fortran程序性能优 阅读全文
摘要:
CUDA中local memory的上限问题 前言 在CUDA编程的过程中,核函数以及device属性的函数内声明的局部变量会有限存储在线程独有的寄存器上,若寄存器容纳不下,比如申请了 一个较大的数组,则会存储在local memory中,在一些书籍和文档中有提到过,local memory是一种特 阅读全文