动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)

合集 - AI(100)

1.CutMix&Mixup详解与代码实战2023-04-27 2.绘画手残党的福音：涂鸦线稿秒变绝美图像2023-05-05 3.探讨AIGC的崛起历程，浅析其背后技术发展2023-05-10 4.创新 = 颠覆？AI创新如何做大蛋糕2023-07-19 5.实践分析丨AscendCL应用编译&运行案例2023-07-26 6.Inpaint Anything：一键进行多种图像修补2023-07-27 7.RT-DETR：可以满足实时性要求的DETR模型2023-07-31 8.华为云盘古大模型辅助药物设计，西交大的新型抗生素研发之路2023-08-01 9.解决大模型“开发难”，昇思MindSpore自动并行技术应用实践2023-08-03 10.一文详解TextBrewer2023-08-08 11.基于Pair-wise和CrossEncoder训练单塔模型2023-08-09 12.基于卷积神经网络的MAE自监督方法2023-08-11 13.晋级名单公布！“域见杯”复赛今日火热开启2023-08-16 14.CutLER：一种用于无监督目标检测和实例分割的方法2023-08-17 15.带你读论文丨S&P21 Survivalism: Living-Off-The-Land 经典离地攻击2023-08-18 16.使用 UCS(On-Premises) 管理您的GPU资源池，释放AI大模型算力潜能2023-08-21 17.带你读论文丨Fuzzing漏洞挖掘详细总结 GreyOne2023-08-22 18.用案例带你认识决策树，解锁洞察力2023-08-22 19.带你读论文丨S&P2019 HOLMES Real-time APT Detection2023-08-23 20.中国图数据库，领导者！2023-08-24 21. 【干货】华为云图数据库GES技术演进2023-08-24 22.带你上手基于Pytorch和Transformers的中文NLP训练框架2023-08-28 23.开放同飞，华为云发布盘古大模型全域协同生态2023-08-31 24.Ascend C保姆级教程：我的第一份Ascend C代码2023-08-31 25.纯干货！一文get昇腾Ascend C编程入门全部知识点2023-09-01 26.3天上手Ascend C编程丨带你认识Ascend C基本概念及常用接口2023-09-05 27.PanGu-Coder2：从排序中学习，激发大模型潜力2023-09-06 28.昇腾实践丨ATC模型转换动态shape问题案例2023-09-08 29.3天上手Ascend C编程丨通过Ascend C编程范式实现一个算子实例2023-09-11 30.华为云盘古大模型加码生物医药，为行业插上“数字翅膀”2023-09-14 31.如何用华为云ModelArts平台玩转Llama22023-09-15 32.教你用API插件开发一个AI快速处理图片小助手2023-09-19 33.大模型时代，如何快速开发AI应用2023-09-20 34.超详细API插件使用教程，教你开发AI垃圾分类机器人2023-09-20 35.三步实现BERT模型迁移部署到昇腾2023-09-21 36.手敲，Ascend算子开发入门笔记分享2023-10-09 37.全域Serverless+AI，华为云加速大模型应用开发2023-10-09 38.教你如何基于MindSpore进行ChatGLM微调2023-10-16 39.从基础到实践，回顾Elasticsearch 向量检索发展史2023-10-23 40.昇腾CANN 7.0 黑科技：大模型训练性能优化之道2023-10-23 41.知识图谱与大模型相结合的3种方法，1+1>22023-11-01 42.IoT与鸿蒙、低代码、生成式AI，引爆技术浪潮——华为云开发者日南京站成功举办2023-11-01 43.带你认识一下多模态对比语言图像预训练CLIP2023-11-02 44.昇腾迁移丨4个TensorFlow模型训练案例解读2023-11-06 45.MoE：LLM终身学习的可能性2023-11-07 46.理论+实践详解最热的LLM应用框架LangChain2023-11-07 47.昇腾CANN DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶2023-11-09 48.昇腾CANN 7.0 黑科技：大模型推理部署技术解密2023-11-10 49.从HumanEval到CoderEval: 你的代码生成模型真的work吗？2023-11-13 50.告别繁琐，ModelArts一键解决车牌号识别难题2023-11-16 51.四载磨砺，一群青年“识瘤者”以AI助力医疗创新2023-11-17 52.一种全新的日志异常检测评估框架：LightAD2023-11-21 53.学生开发者勇担青年使命，用AI守护少数人的“视界”2023-11-21 54.教你如何使用PyTorch解决多分类问题2023-11-22 55.三大基础方案和AI出海计划重磅发布！加速盘古大模型生态发展2023-11-23 56.带你了解大语言模型的前世今生2023-11-27 57.基于AI的架构优化：创新数据集构造法提升Feature envy坏味道检测与重构准确率2023-12-01 58.一种全新的日志异常检测评估框架：LightAD2023-12-04 59.从HumanEval到CoderEval: 你的代码生成模型真的work吗？2023-12-04 60.揭秘华为研发代码大模型是如何实现的2023-12-05 61.大语言模型底层架构丨带你认识Transformer2023-12-06 62.深入解析LLaMA如何改进Transformer的底层结构2023-12-07 63.语言模型：GPT与HuggingFace的应用2023-12-08 64.一文掌握Ascend C孪生调试2023-12-12 65.大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型2023-12-15 66.大语言模型训练数据常见的4种处理方法2023-12-19 67.听6位专家畅谈AI大模型落地实践：场景和人才是关键2024-01-11 68.从工程化角度，详解鹏程·脑海大模型训练过程2024-01-12 69.如何使用MindStudio轻松搞定大模型全流程开发2024-01-19 70.带你熟悉NLP预训练模型：BERT2024-01-22 71.三个方面浅析数据对大语言模型的影响2024-01-25 72.4个大语言模型训练中的典型开源数据集2024-02-01

73.动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)2024-02-26

74.手把手带你快速上手香橙派AIpro2024-03-01 75.想做大模型开发前，先来了解一下MoE2024-03-04 76.一键Run带你体验扩散模型的魅力2024-03-08 77.万字带你了解ChatGLM2024-03-13 78.Sora Opera：天图万境联合华为云共筑AI生成式视频音效新高度2024-03-15 79.鸿蒙x昇腾云：华为打造智能时代最佳AI基础设施2024-03-18 80.从模型到部署，教你如何用Python构建机器学习API服务2024-04-08 81.Ascend C 自定义PRelu算子2024-04-08 82.Ascend C 自定义算子 Kernel Launch调用入门2024-04-09 83.物联网中的预测分析：当IoTDA遇上ModelArts2024-04-09 84.基于香橙派AIpro将开源框架模型转换为昇腾模型2024-04-12 85.“大模型驱动的软件研发” 华为云助推企业研发智能化升级2024-04-12 86.如何基于香橙派AIpro对视频/图像数据进行预处理2024-04-19 87.MindSpore强化学习：使用PPO配合环境HalfCheetah-v2进行训练2024-04-29 88.带你开发一个视频动态手势识别模型2024-04-29 89.第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读2024-05-11 90.华为云引领首个代码大模型国际标准立项2024-05-14 91.共创数字经济新生态，华为云生态领航者·AI先遣队圆满落幕2024-05-16 92.一文教你基于LangChain和ChatGLM3搭建本地知识库问答2024-05-23 93.华为云受邀出席AICon2024 分享AI Agent在企业生产中的技术实践2024-05-24 94.什么是Token？为什么大模型要计算Token数2024-05-27 95.解读注意力机制原理，教你使用Python实现深度学习模型2024-05-27 96.手把手教你基于华为云，实现MindSpore模型训练2024-05-28 97.一文教你如何调用Ascend C算子2024-05-29 98.华为云大咖说：开发者应用AI大模型的“道、法、术”2024-05-30 99.儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑2024-05-31 100.什么是LLM大模型训练，详解Transformer结构模型2024-06-04

本文分享自华为云社区《自动驾驶(AIOT) - 轻量级目标检测与分割算法开发和部署(RK3568)【玩转华为云】》，作者：HouYanSong。

本文将在ModelArts平台上开发轻量级目标检测与分割算法，并使用ModelBox框架在RK3568开发板上实现模型推理和部署。

数据准备

我们收集了一份200张由Labelme标注的道路图像分割数据集，之后使用脚本将其转换为VOC格式的数据集并进行数据增强：

处理好的数据集已经分享到AI Gallery上，可以使用OBS下载：

算法简介

像素级的图像分割不仅需要精确，有时还需要高效以便应用到real-time application比如自动驾驶汽车等。现有的方法可能精度较高但往往参数量巨大，为了解决这个问题，我们使用LinkNet作为主干网络[Fig. 1]，中间层[Fig. 2]使用LeakyRelu进行激活，最后一层使用Sigmoid做归一化，并在Encoder Block 4后增添目标检测分支，训练过程中进行梯度裁剪防止梯度爆炸。

云端训练

算法详情可以运行我发布的Notebook，并下载转换好的模型文件：

ONNXRuntime推理：

下载yolo_tf_seg.zip并解压到本地，之后安装opencv、numpy、onnxruntime即可一键运行。

端侧推理

1、我们在VS Code中使用Remote-SSH远程连接ModelBox端云协同AI开发套件(RK3568)：

2、在SDK目录下使用create.py脚本创建工程object_detection_seg(od_seg)：

3、创建推理功能单元yolo_tf_seg：

4、将转换好的模型放到yolo_tf_seg目录下，我们的模型有一个输入和两个输出：

修改配置文件如下：5、创建后处理功能单元post_process：

对于后处理功能单元，我们在config中配置参数，接收2个float类型的推理结果，返回类别检测框和图像掩码：

对应的逻辑代码如下：

6、创建绘图功能单元draw_image：

对于绘图功能单元，我们接收解码后的原始图像和目标检测框以及分割图像，对应的配置文件如下：

接下来补充逻辑代码生成新的图像：

7、查看流程图：

代码如下：

8、配置输入和输出，运行应用：

9、我们可以在Chrome浏览器chrome://tracing/中加载性能统计文件：

通过分析耗时最久的是推理功能单元，720p视频检测帧率在6fps左右。

小结：

本文总体而言并没有太多的创新点，是一个纯工程化的项目，主要工作是将学术界的优秀论文落地到边缘设备上，通过对网络的魔改，得到一个兼顾精度、速度和体积的目标检测和分割模型，在模型量化过程中会出现精度损失，后续会通过优化算法以及选择不同的量化算法kl_divergence(feature分布不均匀时可以得到较好的改善效果)继续提高模型的检测效果，复现本案例所需资源（代码、模型、测试数据等）均可从object_detection_seg.zip获取。

点击关注，第一时间了解华为云新鲜技术~

posted @ 2024-02-26 14:31 华为云开发者联盟阅读(147) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· ModelBox实战开发：RK3568实现摄像头虚拟背景

· 程序员女友给我做了一个疲劳驾驶检测

· 从菜鸟到高手, HMS Core图像分割服务教你如何在复杂背景里精细抠图

· 目标检测、实例分割、旋转框样样精通！详解高性能检测算法 RTMDet

· 自动驾驶-经典模型

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动！「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业

历史上的今天：
2022-02-26 梦幻联动！金蝶&华为云面向大企业发布数据库联合解决方案
2022-02-26 亿级数据量场景下，如何优化数据库分页查询方法？
2022-02-26 掌握这20个JS技巧，做一个不加班的前端人
2022-02-26 权威可信 | 华为云云测通过中国电子技术标准院软件测试工具能力评价
2021-02-26 用Vue3构建企业级前端应用，TS能让你更轻松点
2021-02-26 华为云GaussDB(for openGauss)商用啦！
2021-02-26 让 AI “潜入”物流中心，你的快递很快就到！

公告

昵称：华为云开发者联盟
园龄： 4年9个月
粉丝： 855
关注： 1

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

合集 (21)

随笔分类 (4020)

随笔档案 (4101)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:基于云主机的ModelArts模型训练实践，让开发环境化繁为简
图片太小了,看不清楚
--反省出梦想
2. Re:深度解读RDS for MySQL 审计日志功能和原理
MySQL企业版提供了审计日志插件，可以对数据库操作进行细粒度的审计。在MySQL社区版中，只是提供了审计日志的相关插件接口定义和功能描述，并不支持原生的审计日志功能。华为云RDS for MyS...
--xiaohuazi
3. Re:打通前后端流程，案例解读华为云开源低代码引擎解决方案
我的创业路径一起来看看吧：
--一叶一花
4. Re:OpenTiny HUICharts开源发布，带你了解一个简单、易上手的图表组件库
这个刷新速度怎么样？5000个点每秒最高刷新速度是多少呢？是否支持散点图、燃尽图、信号
--乙苯道
5. Re:技术解读：华为云如何携手昇腾、鸿蒙等根生态，助力开发者技术创新
arkjs对内存的访问能力、高帧率绘图的能力还是太弱了，不得不借助c++，那这样的语言有什么意义呢，还不如直接借鉴rust
--乙苯道

支持DeepSeek的编程助手