随笔分类 -  AI+计算机视觉

摘要:大部分介绍神经网络的文章中概念性的东西太多,而且夹杂着很多数学公式,读起来让人头疼,尤其没什么基础的人完全get不到作者想要表达的思想。本篇文章尝试零公式(但有少量数学知识)说清楚什么是神经网络,并且举例来说明神经网络能干什么。另外一些文章喜欢举“根据历史交易数据预测房子价值”或者“根据历史数据来预 阅读全文
posted @ 2019-11-04 16:35 周见智 阅读(5138) 评论(18) 推荐(22) 编辑
摘要:算法不是通用的,基于深度学习的应用系统不但做不到通用,即使对于同一类业务场景,还需要为每个场景做定制、特殊处理,这样才能有可能到达实用标准。这种局限性在计算机视觉领域的应用中表现得尤其突出,本文介绍基于深度学习的交通行业视频结构化类应用在实际使用场景中遇到的一些问题。计算机视觉处理的目标是图片,因此 阅读全文
posted @ 2019-10-18 14:46 周见智 阅读(2880) 评论(7) 推荐(4) 编辑
摘要:图像搜索引擎一般有三种实现方式: (1)Search By Metadata,这种方式不会考虑图片本身内容(图片包含物体,以及图像像素分布等),纯粹根据图像标签来进行检索。如果某个网页中有一张赛马的图片,并且网页文本内容中包含“赛马”(或者相关词汇)的文字,当用户搜索“赛马”、“马”、“horse” 阅读全文
posted @ 2019-09-12 15:56 周见智 阅读(4330) 评论(0) 推荐(0) 编辑
摘要:算力和数据是影响深度学习应用效果的两个关键因素,在算力满足条件的情况下,为了到达更好的效果,我们需要将海量、高质量的素材数据喂给神经网络,训练出高精度的网络模型。吴恩达在深度学习公开课中提到,在算力满足要求的前提下,模型效果会随着素材数量的增多而变好,理论上没有上限。实践证明,在普通基于深度学习的应 阅读全文
posted @ 2019-08-02 13:47 周见智 阅读(9155) 评论(6) 推荐(6) 编辑
摘要:基于视频结构化的应用中,目标在经过跟踪算法后,会得到一个唯一标识和它对应的运动轨迹,利用这两个数据我们可以做一些后续工作:测速(交通类应用场景)、计数(交通类应用场景、安防类应用场景)以及行为检测(交通类应用场景、安防类应用场景)。我会写三篇文章依次介绍这三个主题。 (1)目标跟踪之速度计算 (2) 阅读全文
posted @ 2019-07-12 19:42 周见智 阅读(5519) 评论(1) 推荐(3) 编辑
摘要:基于视频结构化的应用中,目标在经过跟踪算法后,会得到一个唯一标识和它对应的运动轨迹,利用这两个数据我们可以做一些后续工作:测速(交通类应用场景)、计数(交通类应用场景、安防类应用场景)以及行为检测(交通类应用场景、安防类应用场景)。我会写三篇文章依次介绍这三个主题。 (1)目标跟踪之速度计算 (2) 阅读全文
posted @ 2019-06-12 18:04 周见智 阅读(5551) 评论(3) 推荐(0) 编辑
摘要:基于视频结构化的应用中,目标在经过跟踪算法后,会得到一个唯一标识和它对应的运动轨迹,利用这两个数据我们可以做一些后续工作:测速(交通类应用场景)、计数(交通类应用场景、安防类应用场景)以及行为检测(交通类应用场景、安防类应用场景)。我会写三篇文章依次介绍这三个主题。 (1)目标跟踪之速度计算 (2) 阅读全文
posted @ 2019-06-06 16:38 周见智 阅读(10695) 评论(0) 推荐(1) 编辑
摘要:下面是在deepstream使用过程中碰到的一些坑: (1)Pipeline中的Sink如果需要编码存文件或者推rtmp的流,注意控制编码的参数,编码质量不要太高。否则可能Sink带不动,整个Pipeline有数据积累,延时越来越高,程序占用的内存越来越大,最终crash。开发中碰到一个问题:刚开始 阅读全文
posted @ 2019-05-30 14:38 周见智 阅读(8567) 评论(2) 推荐(1) 编辑
摘要:机器推理在深度学习的影响下,准确性越来越高、速度越来越快。深度学习对人工智能行业发展的贡献巨大,这得益于现阶段硬件计算能力的提升、互联网海量训练数据的出现。本篇文章主要介绍深度学习过程中如何选择合适的GPU显卡,如果你是深度学习新手,希望这篇文章对你有帮助。 推理用到的硬件分两种,一种是专业AI硬件 阅读全文
posted @ 2019-05-25 18:15 周见智 阅读(17058) 评论(5) 推荐(5) 编辑
摘要:视频结构化的定义 利用深度学习技术实时分析视频中有价值的内容,并输出结构化数据。相比数据库中每条结构化数据记录,视频、图片、音频等属于非结构化数据,计算机程序不能直接识别非结构化数据,因此需要先将这些数据转换成有结构格式,用于后续计算机程序分析。视频结构化最常见的流程为:目标检测、目标分类(属性识别 阅读全文
posted @ 2019-05-08 14:01 周见智 阅读(17938) 评论(9) 推荐(3) 编辑
摘要:背景 在实际项目中,利用深度学习在检测道路车辆并分析车辆行为时,需要按照事先规定的方法绘制检测区(包含道路方向、车道区域等)。由于各种原因(人为、天气),获取视频数据的摄像角度容易偏移原来设定的位置,造成检测区域和实际画面不匹配,系统容易产生误检误报等错误数据。因此需要在摄像机位置偏移第一时间告诉系 阅读全文
posted @ 2018-11-21 13:04 周见智 阅读(7587) 评论(9) 推荐(6) 编辑
摘要:服务端代码后面给出 卡口车型、车牌识别demo截图 服务器: 阅读全文
posted @ 2018-11-20 12:56 周见智 阅读(2422) 评论(1) 推荐(1) 编辑
摘要: 阅读全文
posted @ 2018-11-12 18:32 周见智 阅读(1593) 评论(0) 推荐(0) 编辑
摘要:本文介绍如何将基于深度学习的目标检测算法应用到具体的项目开发中,体现深度学习技术在实际生产中的价值,算是AI算法的一个落地实现。本文算法部分可以参见前面几篇博客: [AI开发]Python+Tensorflow打造自己的计算机视觉API服务 [AI开发]基于深度学习的视频多目标跟踪实现 [AI开发] 阅读全文
posted @ 2018-09-07 12:34 周见智 阅读(7807) 评论(3) 推荐(2) 编辑
摘要:这篇文章详细介绍在centOS7.5上搭建基于keras/tensorflow的深度学习环境,该环境可用于实际生产。本人现在非常熟练linux(Ubuntu/centOS/openSUSE)、windows上该环境的搭建 :) 前面三篇博客代码实现均基于该环境(开发或者测试过): [AI开发]Pyt 阅读全文
posted @ 2018-08-29 16:17 周见智 阅读(1625) 评论(0) 推荐(0) 编辑
摘要:**本文恐怕不是完全的标题党** 视频多目标跟踪需要解决的关键点是前后两帧之间的Target Association,这是最难的环节(没有之一)。第T帧检测到M个目标,第T+S(S>=1)帧检测到N个目标,怎样将这M*N对目标正确地关联起来,是“跟踪算法”最难的环节。(注意这里提到的是多目标,单目标 阅读全文
posted @ 2018-08-22 18:48 周见智 阅读(6592) 评论(3) 推荐(5) 编辑
摘要:据我目前了解掌握,多目标跟踪大概有两种方式: Option1 基于初始化帧的跟踪,在视频第一帧中选择你的目标,之后交给跟踪算法去实现目标的跟踪。这种方式基本上只能跟踪你第一帧选中的目标,如果后续帧中出现了新的物体目标,算法是跟踪不到的。这种方式的优点是速度相对较快。缺点很明显,不能跟踪新出现的目标。 阅读全文
posted @ 2018-07-27 12:01 周见智 阅读(20137) 评论(13) 推荐(5) 编辑
摘要:"与其停留在概念理论层面,不如动手去实现一个简单demo 。" ——鲁迅 没有源码都是耍流氓github 前言 目前提供AI开发相关API接口的公司有很多,国外如微软、谷歌,国内的百度、腾讯等都有开放API接口。开发者只需要调用相关接口,几步就能开发出一个“智能APP”。通常情况AI接口有以下几类: 阅读全文
posted @ 2018-07-06 09:16 周见智 阅读(14185) 评论(4) 推荐(16) 编辑