摘要: CUDA运行时 Runtime(二) 一. 概述 下面的代码示例是利用共享内存的矩阵乘法的实现。在这个实现中,每个线程块负责计算C的一个方子矩阵C sub,块内的每个线程负责计算Csub的一个元素。如图10所示,Csub等于两个矩形矩阵的乘积:与Csub具有相同行索引的维度A(A.width,blo 阅读全文
posted @ 2020-06-04 21:57 吴建明wujianming 阅读(712) 评论(0) 推荐(0) 编辑
摘要: CUDA运行时 Runtime(一) 一. 概述 运行时在cudart库中实现,该库通过静态方式链接到应用程序库cudart.lib和libcudart.a,或动态通过cudart.dll或者libcudart.so. 需要cudart.dll和/或libcudart。索对于动态链接,通常将它们作为 阅读全文
posted @ 2020-06-04 19:46 吴建明wujianming 阅读(3686) 评论(0) 推荐(1) 编辑
摘要: CUDA C++编程接口:编译 一.概述 CUDA C++为熟悉C++编程语言的用户提供了一个简单的路径,以方便地编写程序以执行该设备。 它由一组最小的扩展到C++语言和运行库。 在编程模型中引入了核心语言扩展。它们允许程序员定义内核作为C++函数,并使用一些新的语法来指定每次调用函数时的网格和块维 阅读全文
posted @ 2020-06-04 18:24 吴建明wujianming 阅读(739) 评论(0) 推荐(0) 编辑
摘要: CUDA C++程序设计模型 本章介绍了CUDA编程模型背后的主要概念,概述了它们在C++中的暴露方式。在编程接口中给出了CUDA C++的广泛描述。 使用的矢量加法示例的完整代码可以在矢量加法CUDA示例中找到。 一. 内核 CUDA C++通过允许程序员定义C++函数,称为内核,扩展了C++,当 阅读全文
posted @ 2020-06-04 17:14 吴建明wujianming 阅读(641) 评论(0) 推荐(0) 编辑
摘要: CUDA C++编程手册(总论) CUDA C++ Programming Guide The programming guide to the CUDA model and interface. Changes from Version 10.0 Use CUDA C++ instead of C 阅读全文
posted @ 2020-06-04 14:54 吴建明wujianming 阅读(1764) 评论(0) 推荐(0) 编辑
摘要: 深度学习到底有哪些卷积? 深度学习中不同种类的卷积(比如 2D / 3D / 1x1 /转置/扩张(Atrous)/空间可分/深度可分/平展/分组/混洗分组卷积),能帮理解实际的工作方式。 总结深度学习中常用的几种卷积,并会试图用一种每个人都能理解的方式解释。 本文目录 1.卷积与互相关 2.深度学 阅读全文
posted @ 2020-06-04 13:36 吴建明wujianming 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 卷积神经网络去雾去雨方法 标题:A Convolutional Network for Joint Deraining and Dehazing from A Single Image for Autonomous Driving in Rain 作者:Hao Sun, Marcelo H. Ang 阅读全文
posted @ 2020-06-04 08:24 吴建明wujianming 阅读(1482) 评论(0) 推荐(0) 编辑
摘要: 马斯克如何颠覆航天? 1/5385成本,c++和python编程! 5月31日,经历了重重困难,马斯克的SpaceX载人飞船成功发射,这是美国自2011年以来首次发射载人航天飞船,也是美国进入由商业主导太空探索的历史性时刻,更是全人类在载人航空领域迈出的重要一步。 可以说SpaceX的成功离不开这种 阅读全文
posted @ 2020-06-04 07:08 吴建明wujianming 阅读(2111) 评论(0) 推荐(0) 编辑