有多少人工,就有多少智能

随笔分类 -  模型部署

摘要: 阅读全文
posted @ 2024-07-14 21:10 lvdongjie-avatarx 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-07-14 10:24 lvdongjie-avatarx 阅读(19) 评论(0) 推荐(0) 编辑
摘要:从性能角度来看,TensorRT C++版本和Python版本之间确实存在一些差异: C++版本性能更优: TensorRT C++版本使用了更底层的API,可以更好地利用硬件特性,进行更深层的优化。 C++版本在内存管理、CPU-GPU数据传输等方面更加高效,这些都可以带来更好的推理性能。 Pyt 阅读全文
posted @ 2024-07-13 21:52 lvdongjie-avatarx 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-07-13 21:03 lvdongjie-avatarx 阅读(5) 评论(0) 推荐(0) 编辑
摘要:先介绍TensorRT、Triton的关系和区别: TensorRT:为inference(推理)为生,是NVIDIA研发的一款针对深度学习模型在GPU上的计算,显著提高GPU上的模型推理性能。即一种专门针对高性能推理的模型框架,也可以解析其他框架的模型如tensorflow、torch。 主要优化 阅读全文
posted @ 2024-07-13 18:42 lvdongjie-avatarx 阅读(319) 评论(0) 推荐(0) 编辑
摘要:TensorFlow Serving是一个开源的机器学习模型服务系统,由Google开发并贡献给开源社区。它主要用于部署和管理TensorFlow训练的模型,提供高性能、可扩展的推理服务。 TensorFlow Serving的主要功能和特点包括: 多版本模型管理:支持同时部署和管理多个版本的Ten 阅读全文
posted @ 2024-07-13 17:48 lvdongjie-avatarx 阅读(90) 评论(0) 推荐(0) 编辑
摘要:将YOLOv5与TensorRT结合使用可以显著提高推理速度, 特别是在NVIDIA GPU上。 下面是一个基本的步骤指南, 帮助你了解YOLOv5与TensorRT结合使用的步骤。 人脸检测是一种常见的计算机视觉任务, 下面将详细介绍从模型训练到模型部署的完整流程, 包括使用YOLOv5进行人脸检 阅读全文
posted @ 2024-07-13 16:52 lvdongjie-avatarx 阅读(663) 评论(0) 推荐(0) 编辑
摘要:TensorRT是Nvidia开发的一个高性能深度学习推理引擎。 它主要用于优化和部署已经训练好的深度学习模型, 提高模型在NVIDIA GPU硬件上的推理性能。 TensorRT的主要功能和特点包括: 1. 模型优化 TensorRT提供了一系列优化技术, 包括层融合, 张量格式化, kernel 阅读全文
posted @ 2024-07-13 14:09 lvdongjie-avatarx 阅读(111) 评论(0) 推荐(0) 编辑
摘要:1. 共同目标 - 深度学习模型部署优化 这三者都是用于优化和部署深度学习模型的工具和框架, 目标是提高模型在服务端的推理性能。 2. 技术侧重点不同 TensorRT侧重于针对Nvidia GPU硬件进行深度学习模型的优化与加速。 OpenVINO则针对Inter CPU和FPGA等硬件进行模拟优 阅读全文
posted @ 2024-07-13 11:18 lvdongjie-avatarx 阅读(157) 评论(0) 推荐(0) 编辑