摘要: 随着2020年的发展,远程工作解决方案已成为许多人的新常态。企业正在寻找行之有效的解决方案,如虚拟桌面基础设施(VDI),以使他们的团队能够在任何地方安全地工作。然而,最新的算力和视频会议应用程序需要更强大的台式机来确保良好的用户体验。 借助NVIDIA GRID vPC,它可以经济高效地将虚拟化扩 阅读全文
posted @ 2020-11-21 12:04 吴建明wujianming 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 使用NVIDIA A100 TF32获得即时加速 NVIDIA A100带来了我们公司历史上最大的单代性能增长。这是一个新的结构创新,这是一个多功能的支持,这是一个多功能的结构支持。TF32是用于深度学习训练的绝佳精度,因为它结合了FP32的范围和FP16的精度,与上一代的FP32精度相比,可提供高 阅读全文
posted @ 2020-11-21 11:25 吴建明wujianming 阅读(783) 评论(0) 推荐(0) 编辑
摘要: 使用PCAST检测散度以比较GPU和CPU结果 并行编译器辅助软件测试(PCAST)是英伟达HPC FORTRAN、C++和C编译器中的一个特性。PCAST有两个用例。一个新的处理器或新的编译程序的部分或新的时间标志首先被编译。您可能需要测试新库是否会产生相同的结果,或者测试添加OpenMP并行、启 阅读全文
posted @ 2020-11-21 10:52 吴建明wujianming 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用 编写高性能的软件不是一件简单的任务。当有了可以编译和运行的代码之后,当您尝试并理解它在可用硬件上的执行情况时,将引入一个新的挑战。不同的平台,无论是cpu、gpu还是其他平台,都会有不同的硬件限制,比如可用内存带 阅读全文
posted @ 2020-11-21 09:09 吴建明wujianming 阅读(978) 评论(0) 推荐(0) 编辑