随笔分类 -  Heterogeneous Parallel Programming

胡文美的CUDA公开课,翻译,总结
摘要:CUDA计算模型CUDA中计算分为两部分,串行部分在Host上执行,即CPU,而并行部分在Device上执行,即GPU。相比传统的C语言,CUDA增加了一些扩展,包括了库和关键字。CUDA代码提交给NVCC编译器,该编译器将代码分为Host代码和Device代码两部分。Host代码即为原本的C语言,... 阅读全文
posted @ 2015-01-14 23:07 Magnum Programm Life 阅读(2983) 评论(0) 推荐(2) 编辑
摘要:CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净... 阅读全文
posted @ 2015-01-14 11:50 Magnum Programm Life 阅读(27878) 评论(6) 推荐(17) 编辑