2015年6月23日

CUDA编程接口:共享存储器实现矩阵相乘

摘要: 转自http://cuda.it168.com/a2011/1207/1285/000001285186.shtml正如在前面的文章提到的,共享存储器应当比全局存储器更快,详细内容将在后续文章中介绍。任何用访问共享存储器取代访问全局存储器的机会应当被发掘,如下面的矩阵相乘例子展示的那样。 下面的代码... 阅读全文

posted @ 2015-06-23 23:28 moffis 阅读(566) 评论(0) 推荐(0) 编辑

CUDA学习

摘要: 转自CUDA学习之一CUDA的核心有三个重要抽象概念:线程组层次结构、共享存储器、屏蔽同步(barrier synchronization),可轻松将其作为C语言的最小扩展级公开给程序员。GPU专用于解决可表示为数据并行计算的问题——在许多数据元素上并行执行的程序,具有极高的计算密度(数学运算与存储... 阅读全文

posted @ 2015-06-23 22:15 moffis 阅读(751) 评论(0) 推荐(0) 编辑

CUDA从入门到精通

摘要: 转自http://blog.csdn.net/kkk584520/article/details/9414191CUDA从入门到精通(一):环境搭建NVIDIA于2006年推出CUDA(Compute Unified Devices Architecture),可以利用其推出的GPU进行通用计算,将... 阅读全文

posted @ 2015-06-23 19:34 moffis 阅读(2172) 评论(0) 推荐(0) 编辑

CUDA编程指南阅读笔记

摘要: 转自http://blog.csdn.net/csgxy123/article/category/1500471随着多核CPU和众核GPU的到来,并行编程已经得到了业界越来越多的重视,CPU-GPU异构程序能够极大提高现有计算机系统的运算性能,对于科学计算等运算密集型程序有着非常重要的意义。这一系列... 阅读全文

posted @ 2015-06-23 17:56 moffis 阅读(1683) 评论(0) 推荐(0) 编辑

CUDA最佳实践

摘要: 转自:http://blog.csdn.net/csgxy123/article/details/9569201近期开始学习CUDA编程,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。这一系列文章是根据NVIDIA公司官方文档《CUDA C Best Practices》的内容来进... 阅读全文

posted @ 2015-06-23 17:51 moffis 阅读(607) 评论(0) 推荐(0) 编辑

双边滤波CUDA优化——BilateralFilter CUDA

摘要: 转自:http://sangni007.blog.163.com/blog/static/174728148201481305957863/=======双边滤波概述=======双边滤波(Bilateral filter)是一种可以保边去噪的滤波器。之所以可以达到此去噪效果,是因为滤波器是由两个函... 阅读全文

posted @ 2015-06-23 16:22 moffis 阅读(2144) 评论(0) 推荐(0) 编辑

导航