随笔分类 - TriTon
摘要:
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:从性能角度来看,TensorRT C++版本和Python版本之间确实存在一些差异: C++版本性能更优: TensorRT C++版本使用了更底层的API,可以更好地利用硬件特性,进行更深层的优化。 C++版本在内存管理、CPU-GPU数据传输等方面更加高效,这些都可以带来更好的推理性能。 Pyt
阅读全文
摘要:先介绍TensorRT、Triton的关系和区别: TensorRT:为inference(推理)为生,是NVIDIA研发的一款针对深度学习模型在GPU上的计算,显著提高GPU上的模型推理性能。即一种专门针对高性能推理的模型框架,也可以解析其他框架的模型如tensorflow、torch。 主要优化
阅读全文