摘要: Linux 2 的 Windows 子系统上发布 CUDA 为响应大众需求,微软 宣布 在 2020 年 5 月的 建造 大会上推出了 建造 ( WSL 2 ) – GPU 加速功能。这一特性为许多计算应用程序、专业工具和工作负载打开了大门,目前这些应用程序、专业工具和工作负载只能在 Linux 上 阅读全文
posted @ 2020-12-06 09:30 吴建明wujianming 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 在 CUDA C/C++ kernel中使用内存 如何在主机和设备之间高效地移动数据。本文将讨论如何有效地从内核中访问设备存储器,特别是 全局内存 。 在 CUDA 设备上有几种内存,每种内存的作用域、生存期和缓存行为都不同。到目前为止,已经使用了驻留在设备 DRAM 中的 全局内存 ,用于主机和设 阅读全文
posted @ 2020-12-06 08:54 吴建明wujianming 阅读(226) 评论(0) 推荐(0) 编辑
摘要: CUDA 内存统一分析 关于CUDA 编程的基本知识,如何编写一个简单的程序,在内存中分配两个可供 GPU 访问的数字数组,然后将它们加在 GPU 上。 本文介绍内存统一,这使得分配和访问系统中任何处理器上运行的代码都可以使用的数据变得非常容易, CPU 或 GPU 。 图 1 .内存统一是可从系统 阅读全文
posted @ 2020-12-06 08:22 吴建明wujianming 阅读(1054) 评论(0) 推荐(0) 编辑
摘要: H.264 Video Codec速度和质量 从Kepler开始的所有 NVIDIA GPUs 都支持完全加速的硬件视频编码; GPUs 从费米开始支持完全加速的硬件视频解码。最近发布的图灵硬件提供了张量核心和更好的机器学习性能,但新的 GPU 还加入了新的多媒体功能,如改进的 NVENC 单元,以 阅读全文
posted @ 2020-12-06 07:35 吴建明wujianming 阅读(683) 评论(0) 推荐(0) 编辑
摘要: CUDA 7 Stream流简化并发性 异构计算是指高效地使用系统中的所有处理器,包括 CPU 和 GPU 。为此,应用程序必须在多个处理器上并发执行函数。 CUDA 应用程序通过在 streams 中执行异步命令来管理并发性,这些命令是按顺序执行的。不同的流可以并发地执行它们的命令,也可以彼此无序 阅读全文
posted @ 2020-12-06 06:55 吴建明wujianming 阅读(2339) 评论(0) 推荐(0) 编辑