2020 年 6月 22 日随笔档案 - 吴建明wujianming

2020年6月22日

摘要：将深度学习低延迟推理性能提高一倍 JetPack 3.1 Doubles Jetson’s Low-Latency Inference Performance NVIDIA发布了JetPack 3.1，这是Jetson TX1和TX2的生产Linux软件版本。通过对TensorRT 2.1和cuDN 阅读全文

posted @ 2020-06-22 14:36 吴建明wujianming 阅读(594) 评论(0) 推荐(0) 编辑

TensorRT 3:更快的TensorFlow推理和Volta支持

摘要： TensorRT 3:更快的TensorFlow推理和Volta支持 TensorRT 3: Faster TensorFlow Inference and Volta Support 英伟达TensorRT ™ 是一个高性能的深度学习推理优化器和运行时，为深度学习应用程序提供低延迟、高吞吐量的推理阅读全文

posted @ 2020-06-22 13:12 吴建明wujianming 阅读(951) 评论(0) 推荐(0) 编辑

低层级GPU虚拟内存管理引论

摘要：低层级GPU虚拟内存管理引论 Introducing Low-Level GPU Virtual Memory Management CUDA应用程序越来越需要尽可能快速高效地管理内存。在CUDA 10.2之前，开发人员可用的选项数量仅限于CUDA提供的类似malloc的抽象。 CUDA10.2为虚阅读全文

posted @ 2020-06-22 11:19 吴建明wujianming 阅读(883) 评论(0) 推荐(0) 编辑

将HLSL射线追踪到Vulkan

摘要：将HLSL射线追踪到Vulkan Bringing HLSL Ray Tracing to Vulkan Vulkan标志 DirectX光线跟踪（DXR）允许您使用光线跟踪而不是传统的光栅化方法渲染图形。这个API是NVIDIA和微软在2018年创建的。几个月后，NVIDIA发布了其Turing 阅读全文

posted @ 2020-06-22 09:36 吴建明wujianming 阅读(555) 评论(0) 推荐(0) 编辑

10分钟内基于gpu的目标检测

摘要： 10分钟内基于gpu的目标检测 Object Detection on GPUs in 10 Minutes 目标检测仍然是自动驾驶和智能视频分析等应用的主要驱动力。目标检测应用程序需要使用大量数据集进行大量训练，以实现高精度。NVIDIA gpu在训练大型网络以生成用于对象检测推断的数据集所需的并阅读全文

posted @ 2020-06-22 08:39 吴建明wujianming 阅读(860) 评论(0) 推荐(0) 编辑

基于TensorRT车辆实时推理优化

摘要：基于TensorRT车辆实时推理优化 Optimizing NVIDIA TensorRT Conversion for Real-time Inference on Autonomous Vehicles 自动驾驶系统使用各种神经网络模型，这些模型要求在GPU上进行极其精确和高效的计算。Zoox是阅读全文

posted @ 2020-06-22 06:47 吴建明wujianming 阅读(408) 评论(0) 推荐(0) 编辑

吴建明

公告