AI推理 - 随笔分类 - 珠峰上吹泡泡

Windows下使用ONNXRuntime的GPU进行推理时提示cudnn64_8.dll异常

摘要：一、问题复现将模型放到GPU上推理时时发生的异常。 OrtSessionOptionsAppendExecutionProvider_CUDA(session_options, 0); ... ort_outputs = session_.Run(Ort::RunOptions{ nullptr 阅读全文

posted @ 2024-05-08 09:17 珠峰上吹泡泡阅读(1052) 评论(0) 推荐(0)

深度学习中的动态Shape

摘要：一、概念静态Shape:指在网络执行阶段Tensor的shape没有发生变化；动态Shape:指在网络执行阶段Tensor的shape发生变化。二、动态shape引起的原因输入shape不固定；网络执行过程中有引发shape变化的API；控制流不同分支引入shape上的变化。三、规避策阅读全文

posted @ 2024-05-07 19:14 珠峰上吹泡泡阅读(544) 评论(0) 推荐(0)

libtorch推理速度过慢

摘要：1 原因 torchscript runtime在第一阶段会进行优化 2 解决办法 #include <torch/csrc/jit/python/update_graph_executor_opt.h> torch::jit::setGraphExecutorOptimize(false); 参考阅读全文

posted @ 2024-05-03 17:54 珠峰上吹泡泡阅读(431) 评论(0) 推荐(0)

libtorch使用model.forward报std::runtime_error错误

摘要：1、原因模型向GPU拷贝时发生异常 model = torch::jit::load(ptFile); if (isHalf) { model.to(torch::kHalf); } model.to(device);//GPU版异常，可能模型并没有完全放到GPU上 2、解决方法 model = 阅读全文

posted @ 2024-05-03 09:01 珠峰上吹泡泡阅读(301) 评论(0) 推荐(0)

TensorRT推理YOLOv5

posted @ 2023-09-17 23:58 珠峰上吹泡泡阅读(588) 评论(0) 推荐(0)

GPU与CUDA C编程基本知识

摘要：## 一、CPU与GPU的异同 CPU：延迟导向内核，所谓延迟，指指令发出到得到结果中间经历的时间。 GPU：吞吐导向内核，所谓吞吐量指单位时间内处理的指令数量。其适合于计算密集或者数据并行的场合。 ## 二、CUDA ### 2.1 简介 CUDA（Compute Unified Device 阅读全文

posted @ 2023-08-21 21:59 珠峰上吹泡泡阅读(101) 评论(0) 推荐(0)

珠峰上吹泡泡

To build a better world by code...

随笔分类 - AI推理

公告