摘要: CUDA 9中张量核(Tensor Cores)编程 Programming Tensor Cores in CUDA 9 一.概述 新的Volta GPU架构的一个重要特点是它的Tensor核,使Tesla V100加速器的峰值吞吐量是上一代Tesla P100的32位浮点吞吐量的12倍。Tens 阅读全文
posted @ 2020-06-03 21:25 吴建明wujianming 阅读(3551) 评论(1) 推荐(2) 编辑
摘要: NVIDIA安倍架构 NVIDIA Ampere ArchitectureNVIDIA The Heart of the World’s Highest-Performing, Elastic Data Centers 一.现代数据中心中AI和HPC的核心 科学家、研究人员和工程师我们这个时代的达芬 阅读全文
posted @ 2020-06-03 15:03 吴建明wujianming 阅读(728) 评论(0) 推荐(0) 编辑
摘要: 多实例gpu_MIG技术快速提高AI生产率 Ride the Fast Lane to AI Productivity with Multi-Instance GPUs 一.平台介绍 NVIDIA安培架构中的MIG模式可以在A100 GPU上并行运行七个作业。 二.技术原理 还记得夏天休息后,在饮水 阅读全文
posted @ 2020-06-03 14:10 吴建明wujianming 阅读(815) 评论(0) 推荐(0) 编辑
摘要: GPU核心技术开发 由于上一节主要阐述GPU内部的工作流程和机制,为了简洁性,省略了很多知识点和过程,本节将对它们做进一步补充说明。 1. CUDA技术 1)NVIDIA CUDA 是什么? NVIDIA CUDA 是 NVIDIA 并行计算架构在 GPU 中的名称。NVIDIA 提供了 NVIDI 阅读全文
posted @ 2020-06-03 10:20 吴建明wujianming 阅读(1581) 评论(0) 推荐(0) 编辑
摘要: GPU微观物理结构框架 一.CPU 和 GPU 在物理结构和设计上有何区别 首先需要解释CPU(Central Processing Unit)和GPU(Graphics Processing Unit)这两个缩写分别代表什么。CPU即中央处理器,GPU即图形处理器。其次,要解释两者的区别,要先明白 阅读全文
posted @ 2020-06-03 08:26 吴建明wujianming 阅读(862) 评论(0) 推荐(0) 编辑
摘要: 3D点云点云分割、目标检测、分类 原标题Deep Learning for 3D Point Clouds: A Survey 作者Yulan Guo, Hanyun Wang, Qingyong Hu, Hao Liu, Li Liu, and Mohammed Bennamoun 原文参考链接: 阅读全文
posted @ 2020-06-03 07:00 吴建明wujianming 阅读(19348) 评论(0) 推荐(3) 编辑