摘要:
TensorRT 3:更快的TensorFlow推理和Volta支持 TensorRT 3: Faster TensorFlow Inference and Volta Support 英伟达TensorRT ™ 是一个高性能的深度学习推理优化器和运行时,为深度学习应用程序提供低延迟、高吞吐量的推理 阅读全文
摘要:
低层级GPU虚拟内存管理引论 Introducing Low-Level GPU Virtual Memory Management CUDA应用程序越来越需要尽可能快速高效地管理内存。在CUDA 10.2之前,开发人员可用的选项数量仅限于CUDA提供的类似malloc的抽象。 CUDA10.2为虚 阅读全文
摘要:
将HLSL射线追踪到Vulkan Bringing HLSL Ray Tracing to Vulkan Vulkan标志 DirectX光线跟踪(DXR)允许您使用光线跟踪而不是传统的光栅化方法渲染图形。这个API是NVIDIA和微软在2018年创建的。 几个月后,NVIDIA发布了其Turing 阅读全文
摘要:
10分钟内基于gpu的目标检测 Object Detection on GPUs in 10 Minutes 目标检测仍然是自动驾驶和智能视频分析等应用的主要驱动力。目标检测应用程序需要使用大量数据集进行大量训练,以实现高精度。NVIDIA gpu在训练大型网络以生成用于对象检测推断的数据集所需的并 阅读全文
摘要:
基于TensorRT车辆实时推理优化 Optimizing NVIDIA TensorRT Conversion for Real-time Inference on Autonomous Vehicles 自动驾驶系统使用各种神经网络模型,这些模型要求在GPU上进行极其精确和高效的计算。Zoox是 阅读全文