会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
tangjunjun
博客园
首页
新随笔
联系
订阅
管理
随笔 - 188
文章 - 21
评论 - 11
阅读 -
40万
08 2023 档案
cuda系列详细教程
摘要:随着人工智能的发展与人才的内卷,很多企业已将深度学习算法的C++部署能力作为基本技能之一。面对诸多arm相关且资源有限的设备,往往想更好的提速,满足更高时效性,必将更多类似矩阵相关运算交给CUDA处理。同时,面对市场诸多教程与诸多博客岑子不起的教程或高昂教程费用,使读者(特别是小白)容易迷糊,无法快
阅读全文
posted @
2023-08-07 22:12
tangjunjun
阅读(320)
评论(0)
推荐(0)
编辑
公告
昵称:
tangjunjun
园龄:
5年10个月
粉丝:
16
关注:
7
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔分类
3D(1)
AI-arithmetics(12)
C++(30)
compile-python(30)
Heuristic algorithm(1)
ML-arithmetics(4)
TD-arithmetics(13)
tensorflow(21)
环境(3)
基础(3)
基础知识(6)
模型压缩/加速/部署(4)
人工智能(19)
随笔档案
2024年9月(3)
2023年8月(1)
2023年6月(7)
2023年5月(2)
2023年4月(1)
2023年3月(7)
2022年12月(1)
2022年11月(2)
2022年10月(4)
2022年9月(3)
2022年8月(3)
2022年7月(3)
2022年6月(4)
2022年5月(2)
2022年4月(5)
2022年3月(5)
2022年1月(1)
2021年12月(1)
2021年11月(1)
2021年8月(1)
2021年7月(1)
2021年6月(4)
2021年5月(1)
2021年3月(1)
2021年2月(1)
2020年11月(2)
2020年9月(1)
2020年8月(1)
2020年6月(1)
2020年5月(3)
2020年4月(5)
2020年3月(2)
2020年2月(5)
2020年1月(4)
2019年12月(12)
2019年11月(8)
2019年10月(45)
2019年9月(17)
2019年8月(7)
2019年7月(7)
2019年6月(1)
2019年5月(1)
2019年4月(1)
更多
文章分类
人工智能基础算法(1)
阅读排行榜
1. 张量与数组运算报错(Use Tensor.cpu() to copy the tensor to host memory first;RuntimeError: Expected all tensors to be on the same device)(13547)
2. tqdm()与set_description()的用法(11152)
3. 基于pytorch框架对神经网络权重初始化(inite_weight)方法详解(10734)
4. yaml.load与yaml.dump的用法(10648)
5. np.any()基本用法与不一样环境中的用法(9744)
评论排行榜
1. YOLOV5、YOLOV7使用onnx转tensorrt(engine)(3)
2. NMS的实现代码详解(2)
3. 瑞芯微-交叉编译环境搭建-opencv环境搭建(基于RV1109-1126)-(基于ubuntu18.04)(1)
4. pytorch转onnx及onnx运行详解(1)
5. 残差网络ResNet(超详细代码解析) :你必须要知道backbone模块成员之一 (1)
推荐排行榜
1. @property与@xxx.setter的用法(2)
2. tf.Session()函数的参数应用(tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定)(2)
3. 世界坐标系转换/相机标定/畸变矫正-Python(1)
4. pytorch转onnx及onnx运行详解(1)
5. 相机标定(世界坐标系-->相机坐标系,相机坐标系-->图像坐标系,图像坐标系-->像素坐标系,完成世界坐标系-->像素坐标系)(1)
最新评论
1. Re:瑞芯微-交叉编译环境搭建-opencv环境搭建(基于RV1109-1126)-(基于ubuntu18.04)
你好 ,有个疑问CMAKE_EXE_LINKER_FLAGS=-lpthread -ldl是不对的如果我加上CMAKE_EXE_LINKER_FLAGS=“-lpthread -ldl”的话会影响编译...
--略小白
2. Re:残差网络ResNet(超详细代码解析) :你必须要知道backbone模块成员之一
你好, 我运行代码的时候,在尝试加载 ./resnet50.pth 这个文件的时候出现了错误,所以,方便我找你要一份这个训练模型文件嘛。
--smile+++
3. Re:pytorch转onnx及onnx运行详解
谢谢答主,对我的工作帮助很大!
爱您
--武破立法
4. Re:YOLOV5、YOLOV7使用onnx转tensorrt(engine)
@tangjunjun 收到,非常感谢...
--yangjf7
5. Re:YOLOV5、YOLOV7使用onnx转tensorrt(engine)
@yangjf7 可以按照你说修改下,逻辑与细节问题😅 我没有验证batch的onnx转tensorrt的yolov5,但个人觉得①动态onnx生成 ②trt动态设置(好像需要设置) ③输出格式及后...
--tangjunjun
https://rpc.cnblogs.com/metaweblog/tangjunjun
点击右上角即可分享