摘要: 将深度学习低延迟推理性能提高一倍 JetPack 3.1 Doubles Jetson’s Low-Latency Inference Performance NVIDIA发布了JetPack 3.1,这是Jetson TX1和TX2的生产Linux软件版本。通过对TensorRT 2.1和cuDN 阅读全文
posted @ 2020-06-22 14:36 吴建明wujianming 阅读(594) 评论(0) 推荐(0) 编辑
摘要: TensorRT 3:更快的TensorFlow推理和Volta支持 TensorRT 3: Faster TensorFlow Inference and Volta Support 英伟达TensorRT ™ 是一个高性能的深度学习推理优化器和运行时,为深度学习应用程序提供低延迟、高吞吐量的推理 阅读全文
posted @ 2020-06-22 13:12 吴建明wujianming 阅读(951) 评论(0) 推荐(0) 编辑
摘要: 低层级GPU虚拟内存管理引论 Introducing Low-Level GPU Virtual Memory Management CUDA应用程序越来越需要尽可能快速高效地管理内存。在CUDA 10.2之前,开发人员可用的选项数量仅限于CUDA提供的类似malloc的抽象。 CUDA10.2为虚 阅读全文
posted @ 2020-06-22 11:19 吴建明wujianming 阅读(883) 评论(0) 推荐(0) 编辑
摘要: 将HLSL射线追踪到Vulkan Bringing HLSL Ray Tracing to Vulkan Vulkan标志 DirectX光线跟踪(DXR)允许您使用光线跟踪而不是传统的光栅化方法渲染图形。这个API是NVIDIA和微软在2018年创建的。 几个月后,NVIDIA发布了其Turing 阅读全文
posted @ 2020-06-22 09:36 吴建明wujianming 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 10分钟内基于gpu的目标检测 Object Detection on GPUs in 10 Minutes 目标检测仍然是自动驾驶和智能视频分析等应用的主要驱动力。目标检测应用程序需要使用大量数据集进行大量训练,以实现高精度。NVIDIA gpu在训练大型网络以生成用于对象检测推断的数据集所需的并 阅读全文
posted @ 2020-06-22 08:39 吴建明wujianming 阅读(860) 评论(0) 推荐(0) 编辑
摘要: 基于TensorRT车辆实时推理优化 Optimizing NVIDIA TensorRT Conversion for Real-time Inference on Autonomous Vehicles 自动驾驶系统使用各种神经网络模型,这些模型要求在GPU上进行极其精确和高效的计算。Zoox是 阅读全文
posted @ 2020-06-22 06:47 吴建明wujianming 阅读(408) 评论(0) 推荐(0) 编辑