随笔分类 -  AI+计算机视觉

摘要:项目地址:https://github.com/sherlockchou86/video_pipe_c 往期文章:https://www.cnblogs.com/xiaozhi_5638/p/16969546.html 很久没有更新了,本次记录4个,有兴趣的扫码加群交流。 支持rtsp推流 现在pi 阅读全文
posted @ 2023-12-05 17:02 周见智 阅读(1029) 评论(0) 推荐(2) 编辑
摘要:项目地址:https://github.com/sherlockchou86/video_pipe_c 往期文章:https://www.cnblogs.com/xiaozhi_5638/p/16969546.html 最近有多个更新,有兴趣的扫码加群交流。 新增实例分割相关支持 增加了基于mask 阅读全文
posted @ 2023-03-30 14:18 周见智 阅读(835) 评论(0) 推荐(1) 编辑
摘要:项目地址:https://github.com/sherlockchou86/video_pipe_c 往期文章:https://www.cnblogs.com/xiaozhi_5638/p/16857995.html 11月有3个更新,有兴趣的扫码加群交流。 支持推理结果序列化(vp_messag 阅读全文
posted @ 2022-12-09 17:31 周见智 阅读(998) 评论(0) 推荐(1) 编辑
摘要:VideoPipe从国庆节上线源代码到现在经历过了一个月时间,期间吸引了若干小伙伴的参与,现将本阶段新增内容总结如下,有兴趣的朋友可以加微信拉群交流。 项目地址:https://github.com/sherlockchou86/video_pipe_c 以往文章:https://www.cnblo 阅读全文
posted @ 2022-11-04 15:27 周见智 阅读(1537) 评论(0) 推荐(2) 编辑
摘要:完成多路视频并行接入、解码、多级推理、结构化数据分析、上报、编码推流等过程,插件式/pipe式编程风格,功能上类似英伟达的deepstream和华为的mxvision,但底层核心不依赖复杂难懂的gstreamer框架(少部分地方需要),框架主干部分主要使用原生C++ STL实现,目标是平台高可移植性 阅读全文
posted @ 2022-07-26 13:58 周见智 阅读(1646) 评论(0) 推荐(1) 编辑
摘要:最简单的X->Y映射 读书时代课本上的函数其实就是我们最早接触关于“映射”的概念,f(x)以“某种逻辑”将横坐标轴上的值映射到纵坐标轴。后来学习编程之后接触了函数(或者叫方法)的概念,它以“某种逻辑”将函数输入映射成输出,映射逻辑就是函数本身的实现过程。映射就是将若干输入以某种逻辑转换成若干输出,课 阅读全文
posted @ 2022-03-25 17:00 周见智 阅读(510) 评论(0) 推荐(0) 编辑
摘要:肢体识别本质上还是分类任务,该技术有很多应用场景,比如手势识别控制类应用、动作检测类应用、动作评测类应用、以及一些移动设备AR视频合成类应用。对于纯粹的检测类应用,可以直接对RGB源图像进行分类,当前基于CNN的图像分类技术已经非常成熟和稳定,准确性也完全达到了实用标准。而对于另外涉及到肢体评测、A 阅读全文
posted @ 2021-09-29 16:57 周见智 阅读(5496) 评论(0) 推荐(10) 编辑
摘要:最近在做视频搜索的技术调研,已经初步有了一些成果输出,算法准确性还可以接受,基本达到了调研的预期。现将该技术调研过程中涉及到的内容总结一篇文章分享出来,内容比较多,初看起来可能关系不大,但是如果接触面稍微广一些,就会发现其实原理都是差不多的。 先描述一下我要解决的问题:上传任意一个车辆截图,需要从海 阅读全文
posted @ 2021-06-17 16:34 周见智 阅读(3925) 评论(4) 推荐(7) 编辑
摘要:在基于卷积神经网络的应用过程中,图像Resize是必不可少的一个步骤。通常原始图像尺寸比较大,比如常见监控摄像机出来的是1080P高清或者720P准高清画面,而网络模型输入一般没有这么大,像Yolo系列目标检测的网络模型输入大小一般为608*608/512*512 等等。那么如何将大尺寸图像输入到网 阅读全文
posted @ 2021-04-02 17:00 周见智 阅读(6316) 评论(2) 推荐(0) 编辑
摘要:在这个大家都在摸鱼、熬时间、等年终奖的“空闲时间”(哈哈),我整理了一篇文章,之前已经发过公众号,有兴趣的朋友可以关注一下。 做过基于目标检测算法应用的人可能会碰到这样一个问题:算法在检测连续视频帧时,视频中同一个目标的检测框经常出现抖动、有时候目标还出现若干帧检测不到的情况(漏检),哪怕整个视频画 阅读全文
posted @ 2021-02-04 11:46 周见智 阅读(5245) 评论(0) 推荐(4) 编辑
摘要:右键打开查看原图 阅读全文
posted @ 2020-11-17 18:35 周见智 阅读(1454) 评论(0) 推荐(0) 编辑
摘要:与多目标跟踪(Multiple Object Tracking简称MOT)对应的是单目标跟踪(Single Object Tracking简称SOT),按照字面意思来理解,前者是对连续视频画面中多个目标进行跟踪,后者是对连续视频画面中单个目标进行跟踪。由于大部分应用场景都涉及到多个目标的跟踪,因此多 阅读全文
posted @ 2020-10-20 11:47 周见智 阅读(18487) 评论(1) 推荐(18) 编辑
摘要:过去两个月团队一直在忙着将基于后端分析的技术方案移植到前端设备,由于都是英伟达的硬件平台,迁移过程还算顺利。下面分享一下什么是后端分析、什么是前端分析、什么又是边缘分析,当然叫后端计算、前端计算、边缘计算也行。下面这个动图就是我们采用前端分析方案的效果,具体硬件是Jetson Xavier NX 嵌 阅读全文
posted @ 2020-08-19 14:50 周见智 阅读(2724) 评论(0) 推荐(3) 编辑
摘要:下一篇讲详细原理和方法,这里是demo AI换脸,杨澜->赵本山 阅读全文
posted @ 2020-05-19 16:23 周见智 阅读(855) 评论(0) 推荐(0) 编辑
摘要:大概两三年前微软发布了一个基于Cognitive Service API的how-old.net网站,用户可以上传一张包含人脸的照片,后台通过调用深度学习算法可以预测照片中的人脸、年龄以及性别,然后将结果绘制到原图片上返回给用户。那时候深度学习技术在国内刚流行不久(2016年前后),当时这个网站一度 阅读全文
posted @ 2020-05-07 14:16 周见智 阅读(1363) 评论(0) 推荐(2) 编辑
摘要:人脸应用在计算机视觉体系中占很大一块,在深度学习火起来之前,基于传统机器学习的人脸应用就已经很成熟了,有很多商用应用场景。本文用一个可以实际运行的Demo来说明人脸应用中常见的技术概念,包含‘人脸检测’、‘人脸对比’、‘人脸表征检测(五官定位)’、‘眨眼检测’、‘活体检测’以及‘疲劳检测’。 人脸检 阅读全文
posted @ 2020-04-14 13:48 周见智 阅读(6153) 评论(3) 推荐(6) 编辑
摘要:深度学习现在这么火热,大部分人都会有‘那么它与机器学习有什么关系?’这样的疑问,网上比较它们的文章也比较多,如果有机器学习相关经验,或者做过类似数据分析、挖掘之类的人看完那些文章可能很容易理解,无非就是一个强调‘端到端’全自动处理,一个在特征工程上需要耗费大量时间和精力(半自动处理);一个算法更复杂 阅读全文
posted @ 2020-04-02 16:50 周见智 阅读(6286) 评论(2) 推荐(2) 编辑
摘要:这篇文章的标题比较奇怪,网上可能很少类似专门介绍神经网络的输入输出相关文章。在我实际工作和学习过程中,发现很有必要对神经网络的输入和输出做一个比较全面地介绍。跟之前博客一样,本篇文章不会出现相关代码或者公式之类的,还是希望用更直观的图文来说明问题,读者不太可能通过阅读文章来获取代码或者解决方案从而直 阅读全文
posted @ 2020-03-29 12:53 周见智 阅读(5745) 评论(0) 推荐(1) 编辑
摘要:这篇文章其实主要是想介绍在深度学习过程中如何使用小型数据集,这种数据集样本数量一般在1000以下,有时候甚至只有几百。一般提到神经网络,大家都会说数据量越丰富,准确性越高,但是实际工作中,可能收集不了大量的训练样本,那么这时候该如何利用有限的数据集去实现我们想要的功能,并且还能得到相对不错的效果呢? 阅读全文
posted @ 2020-01-16 17:06 周见智 阅读(2773) 评论(4) 推荐(3) 编辑
摘要:视频结构化类应用涉及到的技术栈比较多,而且每种技术入门门槛都较高,比如视频接入存储、编解码、深度学习推理、rtmp流媒体等等。每个环节的水都非常深,单独拿出来可以写好几篇文章,如果没有个几年经验基本很难搞定。本篇文章简单介绍视频结构化类应用涉及到的技术栈,以及这类应用常见结构,因为是实时视频分析,因 阅读全文
posted @ 2020-01-07 16:31 周见智 阅读(5776) 评论(7) 推荐(9) 编辑