2015 年 6月 23 日随笔档案 - moffis

CUDA编程接口：共享存储器实现矩阵相乘

摘要：转自http://cuda.it168.com/a2011/1207/1285/000001285186.shtml正如在前面的文章提到的，共享存储器应当比全局存储器更快，详细内容将在后续文章中介绍。任何用访问共享存储器取代访问全局存储器的机会应当被发掘，如下面的矩阵相乘例子展示的那样。下面的代码... 阅读全文

posted @ 2015-06-23 23:28 moffis 阅读(566) 评论(0) 推荐(0) 编辑

CUDA学习

摘要：转自CUDA学习之一CUDA的核心有三个重要抽象概念：线程组层次结构、共享存储器、屏蔽同步（barrier synchronization），可轻松将其作为C语言的最小扩展级公开给程序员。GPU专用于解决可表示为数据并行计算的问题——在许多数据元素上并行执行的程序，具有极高的计算密度（数学运算与存储... 阅读全文

posted @ 2015-06-23 22:15 moffis 阅读(751) 评论(0) 推荐(0) 编辑

CUDA从入门到精通

摘要：转自http://blog.csdn.net/kkk584520/article/details/9414191CUDA从入门到精通（一）：环境搭建NVIDIA于2006年推出CUDA（Compute Unified Devices Architecture），可以利用其推出的GPU进行通用计算，将... 阅读全文

posted @ 2015-06-23 19:34 moffis 阅读(2172) 评论(0) 推荐(0) 编辑

CUDA编程指南阅读笔记

摘要：转自http://blog.csdn.net/csgxy123/article/category/1500471随着多核CPU和众核GPU的到来，并行编程已经得到了业界越来越多的重视，CPU-GPU异构程序能够极大提高现有计算机系统的运算性能，对于科学计算等运算密集型程序有着非常重要的意义。这一系列... 阅读全文

posted @ 2015-06-23 17:56 moffis 阅读(1683) 评论(0) 推荐(0) 编辑

CUDA最佳实践

摘要：转自：http://blog.csdn.net/csgxy123/article/details/9569201近期开始学习CUDA编程，需要阅读很多资料，为了便于整理复习，特将阅读笔记记录，以备后用。这一系列文章是根据NVIDIA公司官方文档《CUDA C Best Practices》的内容来进... 阅读全文

posted @ 2015-06-23 17:51 moffis 阅读(607) 评论(0) 推荐(0) 编辑

双边滤波CUDA优化——BilateralFilter CUDA

摘要：转自：http://sangni007.blog.163.com/blog/static/174728148201481305957863/=======双边滤波概述=======双边滤波（Bilateral filter）是一种可以保边去噪的滤波器。之所以可以达到此去噪效果，是因为滤波器是由两个函... 阅读全文

posted @ 2015-06-23 16:22 moffis 阅读(2144) 评论(0) 推荐(0) 编辑

moffis