摘要:
在深入研究如何编写设备代码之前,我们需要通过某种机制来判断计算机中当前有哪些设备,以及每个设备都支持哪些功能。幸运的是,可以通过一个非常简单的接口来获得这种信息。首先,我们希望知道在系统中有多少个设备是支持CUDA架构的,并且这些设备能够运行基于CUDA C编写的核函数。要获得CUDA设备的数量,可 阅读全文
摘要:
需要注意的是,最简单的cuda代码中也使用了一些通用模式: ·调用cudaMalloc()在设备上为三个数组分配内存:在其中两个数组(dev_a和dev_b)中包含了输入值,而在数组dev_c中包含了计算结果。· 为了避免内存泄露,在使用完GPU内存后通过cudaFree(O释放它们。· 通过cud 阅读全文
摘要:
GPU和中央处理单元(CPU)是完全不同的计算架构。前者最初是旨在加速视频数据处理。近年来,GPU已成为专门为并行计算设计的硬件组件。让我们用一个例子来说明这一点。假设我们希望在书中查找一个特定的单词。如果任务交给了CPU,它会从第一页到最后一页完整地阅读这本书,以查找单词,因为CPU是串行处理器, 阅读全文
摘要:
基于两点地质统计学的传统方法包括序贯高斯模拟(SGS)(Journel和Isaaks,1984年;Goovaerts,1997年;Sahimi,2011年)、序贯指标模拟(SIS)(Goovaert,1997年,Sahimi,2011年)和联合模拟方法(Goovaertes,1997年、Chiles 阅读全文