tensorrt与tvm

tensorrt 和tvm都是用于训练后模型的部署的，它们能够多模型进行量化、算子融合等，使模型运行更快。

如果采用GPU硬件平台，一般会使用TensorRT方式部署，因为TensorRT能够充分发挥GPU平台的性能，同时也做了很多的优化（算子融合，量化等），所以在性能上有比较大的优势。不过，TensorRT是闭源的，用户无法知道Nvidia究竟做了什么。

与TensorRT相对标的一个开源项目就是陈天奇搞的TVM项目，目前正在不断迭代中，它的目标也是解决训练模型部署的问题，支持的硬件的平台包括了X86、ARM以及GPU。