2020 年 12月 30 日随笔档案 - 吴建明wujianming

2020年12月30日

摘要：双精度张量内核加快了高性能计算通过NVIDIA Ampere架构，仿真和迭代求解器可将FP64数学提高多达2.5倍。模拟可以帮助了解黑洞的奥秘，并了解冠状病毒上的蛋白质尖峰如何导致COVID-19。还可以让设计师创建从时尚汽车到喷气发动机的所有东西。但是仿真也是地球上最苛刻的计算机应用程序之一阅读全文

posted @ 2020-12-30 14:09 吴建明wujianming 阅读(296) 评论(0) 推荐(0) 编辑

A100计算能力

摘要： A100计算能力 A100 GPU支持新的计算功能8.0。表1比较了NVIDIA GPU架构的不同计算功能的参数。表1.计算能力：GP100 vs. GV100 vs. GA100。 MIG架构尽管许多数据中心的工作量在规模和复杂性上都在继续扩展，但某些加速任务的要求却不高，例如早期开发或推断小阅读全文

posted @ 2020-12-30 14:00 吴建明wujianming 阅读(870) 评论(0) 推荐(0) 编辑

A100 Tensor核心可加速HPC

摘要： A100 Tensor核心可加速HPC HPC应用程序的性能需求正在迅速增长。众多科学研究领域的许多应用程序都依赖于双精度（FP64）计算。为了满足HPC计算快速增长的计算需求，A100 GPU支持Tensor操作，以加速符合IEEE的FP64计算，提供的FP64性能是NVIDIA Tesla V 阅读全文

posted @ 2020-12-30 13:49 吴建明wujianming 阅读(451) 评论(0) 推荐(0) 编辑

A100 GPU硬件架构

摘要： A100 GPU硬件架构 NVIDIA GA100 GPU由多个GPU处理群集（GPC），纹理处理群集（TPC），流式多处理器（SM）和HBM2内存控制器组成。 GA100 GPU的完整实现包括以下单元：每个完整GPU 8个GPC，8个TPC / GPC，2个SM / TPC，16个SM / GP 阅读全文

posted @ 2020-12-30 13:36 吴建明wujianming 阅读(2114) 评论(0) 推荐(0) 编辑

NVIDIA深度架构

摘要： NVIDIA深度架构今天，在2020年NVIDIA GTC主题演讲中，NVIDIA创始人兼首席执行官黄仁勋介绍了基于新NVIDIA Ampere GPU架构的新NVIDIA A100 GPU。本文介绍新的A100 GPU，并介绍了NVIDIA Ampere架构GPU的重要新功能。现代云数据中心中阅读全文

posted @ 2020-12-30 13:25 吴建明wujianming 阅读(503) 评论(0) 推荐(0) 编辑

稀疏性如何为AI推理增加难度

摘要：稀疏性如何为AI推理增加难度 NVIDIA Ampere架构使数学运算加倍，以加速对各种神经网络的处理。如果曾经玩过游戏Jenga，那么将有一些AI稀疏感。玩家将木制积木交叉成一列。然后，每个玩家轮流小心地移开一个障碍物，而不会倾倒立柱。它从一开始就很容易，但是变得越来越毛茸茸，直到失败的玩家阅读全文

posted @ 2020-12-30 08:43 吴建明wujianming 阅读(268) 评论(0) 推荐(0) 编辑

cuSPARSELt开发NVIDIA Ampere结构化稀疏性

摘要： cuSPARSELt开发NVIDIA Ampere结构化稀疏性深度神经网络在各种领域（例如计算机视觉，语音识别和自然语言处理）中均具有出色的性能。处理这些神经网络所需的计算能力正在迅速提高，因此有效的模型和计算至关重要。神经网络剪枝（删除不必要的模型参数以生成稀疏网络）是一种在保持准确性的同时降低阅读全文

posted @ 2020-12-30 08:14 吴建明wujianming 阅读(574) 评论(0) 推荐(0) 编辑

在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据

摘要：在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据如今，最流行的拍照设备智能手机可以捕获高达4K UHD的图像（3840×2160图像），原始数据超过25 MB。即使考虑到令人尴尬的低HD分辨率（1280×720），原始图像也需要超过2.5 MB的存储空间。存储少至阅读全文

posted @ 2020-12-30 07:17 吴建明wujianming 阅读(461) 评论(0) 推荐(0) 编辑

在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库

摘要：在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库根据调查，普通人产生的1.2万亿张图像可以通过电话或数码相机捕获。这样的图像的存储，尤其是以高分辨率的原始格式，会占用大量内存。 JPEG指的是联合图像专家组，该组织于2017年庆祝成立25周年。JPEG标准指定阅读全文

posted @ 2020-12-30 06:52 吴建明wujianming 阅读(1283) 评论(0) 推荐(0) 编辑

nvJPEG Codec库

摘要： nvJPEG Codec库 nvJPEG库是高性能的GPU加速库，用于解码，编码和转码JPEG格式的图像。nvJPEG2000库用于解码JPEG 2000格式的图像。与单CPU解码相比，依赖nvJPEG或nvJPEG2000进行解码的应用程序可提供更高的吞吐量和更低的延迟。 nvJPEG nvJPE 阅读全文

posted @ 2020-12-30 06:09 吴建明wujianming 阅读(1346) 评论(0) 推荐(0) 编辑

吴建明

公告