05 2020 档案
摘要:多目标姿态估计 一个openpose的姿态估计算法,这个算法可以检测人体的18个关节点。 安装OpenPose 这个是来自卡内基梅隆的开源算法,算法真的很鲁棒,不信来看看效果。 openpose这个算法集成Convolutional Pose Machines、Realtime Multi-Pers
阅读全文
摘要:数据标注的困境 众所周知,机器学习主要分为两类:监督学习(supervised learning)与无监督学习(unsupervised learning)。而监督学习离不开数据标注(data labeling),也就是依靠人工 找到groundtruth。 标注平台 标注平台这今年开年如雨后春笋般
阅读全文
摘要:如何部署自动驾驶系统 自动驾驶软件部署方法、装置、终端及服务器,更具体的涉及一种自动驾驶车辆行驶途中下一地理位置区域所调用的自动驾驶软件部署方法、装置、终端及服务器。背景技术随着城市化建设带来的人口高度集中和交通产业的不断发展,社会对智能交通系统如何提供更加便捷、高效和人性化的服务,提出了越来越高的
阅读全文
摘要:IoU、GIoU、DIoU、CIoU损失函数 目标检测任务的损失函数由Classificition Loss和Bounding Box Regeression Loss两部分构成。目标检测任务中近几年来Bounding Box Regression Loss Function的演进过程,其演进路线是
阅读全文
摘要:YOLOv4没交棒,但YOLOv5来了! 前言 4月24日,YOLOv4来了! 5月30日,"YOLOv5"来了! 这里的 "YOLOv5" 是带有引号的,因为 Amusi 认为网上刚出来的这个版本并称不上YOLOv5。这也是为什么标题为:大神没交棒,但YOLOv5来了! YOLO原项目darkne
阅读全文
摘要:全卷积实例分割实战 Fully Convolutional Instance-aware Semantic Segmentation 介绍 FCIS是一个完全卷积的端到端解决方案,例如分割,它赢得了2016年COCO分割挑战赛的第一名。FCIS最初在CVPR 2017聚光灯文件中进行了描述。值得注意
阅读全文
摘要:NeuWare软件开发环境 NeuWare 全面支持各类主流编程框架(如TensorFlow,Caffe,Caffe2,MXNet和ONNX等)。用户可面向上述编程框架,便捷地在MLU100上开发和部署深度学习应用。同时,NeuWare提供了完整的运行时系统和驱动软件,方便系统快速集成。 NeuWa
阅读全文
摘要:人体姿态估计 人体姿态估计(Human Pose Detection)是计算机视觉中的一个重要分支,应用范围宽广,比如在自动驾驶行业进行街景中行人的姿态检测、动作预测;在安防领域的行人再识别问题,特殊场景的特定动作监控;影视产业的电影特效等。 Openpose是卡内基梅隆大学提出的一种人体姿态检测模
阅读全文
摘要:Pytorch和CNN图像分类 PyTorch是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。它主要由Facebookd的人工智能小组开发,不仅能够 实现强大的GPU加速,同时还支持动态神经网络,这一点是现在很多主流框架如TensorFlow都不支持的。 PyTorch
阅读全文
摘要:3D点云深度学习 在自动驾驶中关于三维点云的深度学习方法应用、三维场景语义理解的方法以及对应的关键技术介绍。 1. 数据 但是对于3D点云,数据正在迅速增长。大有从2D向3D发展的趋势,比如在opencv中就已经慢慢包含了3D点云的处理的相关模块,在数据方面点云的获取也是有多种渠道, 无论是源于CA
阅读全文
摘要:TensorFlow基础剖析 一.概述 TensorFlow 是一个使用数据流图 (Dataflow Graph) 表达数值计算的开源软件库。它使 用节点表示抽象的数学计算,并使用 OP 表达计算的逻辑;而边表示节点间传递的数据流, 并使用 Tensor 表达数据的表示。数据流图是一种有向无环图 (
阅读全文
摘要:Caffe框架GPU与MLU计算结果不一致请问如何调试? 某一检测模型移植到Cambricon Caffe上时,发现无法检测出结果,于是将GPU和MLU的运行结果输出并保存后进行对比,发现二者计算结果不一致,如下图所示: 第一张为GPU模式下,第二张为GPU模式,二者使用的输入和数据预处理方式均完全
阅读全文
摘要:YOLOv5目标检测源码重磅发布了! https://github.com/ultralytics/yolov5 该存储库代表了对未来对象检测方法的超解析开源研究,并结合了在使用之前的YOLO存储库在自定义客户机数据集上训练数千个模型时所吸取的经验教训和改进的最佳实践https://github.c
阅读全文
摘要:NVIDIA深度学习Tensor Core性能解析(下) DeepBench推理测试之RNN和Sparse GEMM DeepBench的最后一项推理测试是RNN和Sparse GEMM,虽然测试中可以选择FP16,但实际上它们都只支持FP32运算。 虽然RNN可能会有加速,但DeepBench和N
阅读全文
摘要:NVIDIA深度学习Tensor Core性能解析(上) 本篇将通过多项测试来考验Volta架构,利用各种深度学习框架来了解Tensor Core的性能。 很多时候,深度学习这样的新领域会让人难以理解。从框架到模型,再到API和库,AI硬件的许多部分都是高度定制化的,因而被行业接受的公开基准测试工具
阅读全文
摘要:Tensor Core技术解析(下) 让FP16适用于深度学习 Volta的深度学习能力是建立在利用半精度浮点(IEEE-754 FP16)而非单精度浮点(FP32)进行深度学习训练的基础之上。 该能力首先由cuDNN 3支持并在Tegra X1的Maxwell架构中实现,随后原生半精度计算被引入P
阅读全文
摘要:Tensor Core技术解析(上) NVIDIA在SIGGRAPH 2018上正式发布了新一代GPU架构——Turing(图灵),黄仁勋称Turing架构是自2006年CUDA GPU发明以来最大的飞跃。Turing架构的两大重要特性便是集成了用于光线追踪的RT Core以及用于AI计算的Tens
阅读全文
摘要:常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet 一.概述 近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括TensorFlow,Keras,MXNet,PyTorch,CNTK,Theano,Caffe,DeepLe
阅读全文
摘要:怎样训练YOLOv3 Training YOLOv3 : Deep Learning based Custom Object Detector 本文将在一些公开的雪人图片和视频上分享训练过程、有助于训练的脚本和结果。可以使用相同的过程来训练具有多个目标检测。 先下载代码,例如, 下载地址一:http
阅读全文
摘要:单目视觉里程计性能估计 D3VO: Deep Depth, Deep Pose and Deep Uncertaintyfor Monocular Visual Odometry 论文地址:https://arxiv.org/pdf/2003.01060.pdf 摘要 CVPR2020一篇关于视觉里
阅读全文
摘要:自监督学习(Self-Supervised Learning)多篇论文解读(下) 之前的研究思路主要是设计各种各样的pretext任务,比如patch相对位置预测、旋转预测、灰度图片上色、视频帧排序等等。CVPR19和ICCV19上,Google Brain的几个研究员发表了两篇论文,从另外的视角分
阅读全文
摘要:自监督学习(Self-Supervised Learning)多篇论文解读(上) 前言 Supervised deep learning由于需要大量标注信息,同时之前大量的研究已经解决了许多问题。所以近期大家的研究关注点逐渐转向了Unsupervised learning,许多顶会包括ICML, N
阅读全文
摘要:服务器技术综述(一) 本文对服务器的概念、服务器重要部件技术和架构组成,并且对磁盘、RAID知识,网卡等知识做了深度详细介绍。 简单来说,服务器就是在网络中为其他客户机提供服务的计算机;具有高性能、高可靠、高IO数据传输能力等特点,企业从基础的邮件、打印到核心应用如ERP、数据库等业务,再到我们所熟
阅读全文
摘要:TensorRT-优化-原理 一.优化方式 TentsorRT 优化方式: TensorRT优化方法主要有以下几种方式,最主要的是前面两种。 层间融合或张量融合(Layer & Tensor Fusion) 如下图左侧是GoogLeNetInception模块的计算图。这个结构中有很多层,在部署模型
阅读全文
摘要:TensorRT-安装-使用 一.安装 这里 是英伟达提供的安装指导,如果有仔细认真看官方指导,基本上按照官方的指导肯定能安装成功。 问题是肯定有很多人不愿意认真看英文指导,比如说我就是,我看那个指导都是直接找到命令行所在,直接敲命令,然后就出了很多问题,然后搜索好长时间,最后才发现,原来官方ins
阅读全文
摘要:TensorRT 加速性能分析 Out-of-the-box GPU Performance 模型推理性能是什么意思?在为用户评估潜在的候选项时,不测量数据库查询和预筛选(例如决策树或手动逻辑)的贡献。使用估计器对特征列进行预处理,并通过网络复制输入/结果。 有两个主要推理上下文: 离线推理-一次预
阅读全文
摘要:GPU加速:宽深度推理 Accelerating Wide & Deep Recommender Inference on GPUs 推荐系统推动了许多最流行的在线平台的参与。随着为这些系统提供动力的数据量的快速增长,数据科学家正越来越多地从更传统的机器学习方法转向高度表达的深度学习模型,以提高其建
阅读全文
摘要:NVIDIA TensorRT:可编程推理加速器 一.概述 NVIDIA TensorRT™是一个用于高性能深度学习推理的SDK。它包括一个深度学习推理优化器和运行时间,为深度学习推理应用程序提供低延迟和高吞吐量。 在推理过程中,基于TensorRT的应用程序执行速度比仅限CPU的平台快40倍。使用
阅读全文
摘要:寒武纪端云一体人工智能开发平台整体架构 1. 引言 当前人工智能(Artificial Intelligence)技术发展迅猛,在机器视觉、语音识别以及自然语言处理等多个技术领域取得了卓越的进展,带来了更高的精确度和泛化能力,因此越来越广泛地应用于众多行业领域,形成了智慧制造、智慧金融、智慧交通、智
阅读全文
摘要:寒武纪人工智能开发平台 寒武纪人工智能开发平台(Cambricon Neuware™)是寒武纪专门针对其云、边、端的智能处理器产品打造的软件开发平台, Neuware采用端云一体的架构,可同时支持寒武纪云、边、端的全系列产品。 寒武纪终端IP、边缘端芯片及云端芯片共享同样的软件接口和完备生态,可以方
阅读全文
摘要:汽车车灯灯具系统(下) 发展史 汽车照明的发展史大体上经过如下四个阶段:汽车灯具的演变随着汽车光源的更迭而发生。 第一代汽车照明系统是由燃料(蜡烛、煤油或乙炔)直接燃烧发光。但存在发光效率很低、光强弱、性能不稳定、操作复杂等明显缺点。能满足早期车灯的要求。 第二代汽车照明系统是白炽灯。1879年爱迪
阅读全文
摘要:汽车车灯灯具系统(上) 汽车照明系统是汽车安全行驶的必备系统之一。它主要包括“外部照明灯具、内部照明灯具、外部信号灯具、内部信号灯具等。 分类 汽车灯具按照功能功用划分,主要有两个种类:“汽车照明灯和汽车信号灯”。 汽车照明灯按照其安装的位置及功用包括:“ 前照灯、雾灯、牌照灯、仪表灯 、顶灯、工作
阅读全文
摘要:语义和边缘:从噪声和符号中学习 Devilis in the Edges: Learning Semantic Boundaries from Noisy Annotations 论文地址:https://arxiv.org/pdf/1904.07934.pdf 项目链接:https://nv-tl
阅读全文
摘要:AI解决方案:边缘计算和GPU加速平台 一.适用于边缘 AI 的解决方案 AI 在边缘蓬勃发展。AI 和云原生应用程序、物联网及其数十亿的传感器以及 5G 网络现已使得在边缘大规模部署 AI 成为可能。但它需要一个可扩展的加速平台,能够实时推动决策,并让各个行业都能为行动点(商店、制造工厂、医院和智
阅读全文
摘要:GPU与显卡 一.什么是GPU? GPU这个概念是由Nvidia公司于1999年提出的。GPU是显卡上的一块芯片,就像CPU是主板上的一块芯片。那么1999年之前显卡上就没有GPU吗?当然有,只不过那时候没有人给它命名,也没有引起人们足够的重视,发展比较慢。 自Nvidia提出GPU这个概念后,GP
阅读全文
摘要:图像处理 100 问!! 参考链接地址:https://github.com/gzr2017/ImageProcessing100Wen English is here (KuKuXia translates into English) https://github.com/KuKuXia/Imag
阅读全文
摘要:匹配算法:局部结构保留 Locality Preserving Matching 论文地址:https://www.ijcai.org/Proceedings/2017/0627.pdf 摘要 在计算机视觉中,获取两个特征集合的可靠的匹配关系是一个基础而又重要的任务。本文要解决的问题是,在已知两个特
阅读全文
摘要:图像拼接技术 简介 图像拼接是将同一场景的多个重叠图像拼接成较大的图像的一种方法,在医学成像、计算机视觉、卫星数据、军事目标自动识别等领域具有重要意义。图像拼接的输出是两个输入图像的并集。所谓图像拼接就是将两张有共同拍摄区域的图像无缝拼接在一起。这种应用可应用于车站的动态检测、商城的人流检测、十字路
阅读全文
摘要:SLAM的通用框架:GSLAM GSLAM: A General SLAM Framework and Benchmark 论文链接: http://openaccess.thecvf.com/content_ICCV_2019/papers/Zhao_GSLAM_A_General_SLAM_Fr
阅读全文
摘要:Docker_Swarm集群系统 一.Docker Swarm 介绍 实践中会发现,生产环境中使用单个 Docker 节点是远远不够的,搭建 Docker 集群势在必行。然而,面对 Kubernetes, Mesos 以及 Swarm 等众多容器集群系统,该如何选择呢?它们之中,Swarm 是 Do
阅读全文
摘要:多传感器融合(三) 十三.前融合与后融合 多传感器融合技术中的前融合、后融合 后融合算法典型结构 后融合算法: 1、每个传感器各自独立处理生成的目标数据。 2、每个传感器都有自己独立的感知,比如激光雷达有激光雷达的感知,摄像头有摄像头的感知,毫米波雷达也会做出自己的感知。 3、当所有传感器完成目标数
阅读全文
摘要:多传感器融合(二) 七.摄像头 摄像头:智能驾驶之慧眼 车载摄像头是实现众多预警、识别类 ADAS 功能的基础。在众多 ADAS 功能中,视觉影像处理系统较为基础,对于驾驶者也更为直观,而摄像头又是视觉影像处理系统的基础, 因此车载摄像头对于自动驾驶必不可少。 摄像头可实现的 ADAS 功能 以上众
阅读全文
摘要:多传感器融合(一) 一.概述 “传感器融合技术”号称自动驾驶中的核心技术。 传感器是汽车感知周围的环境的硬件基础,在实现自动驾驶的各个阶段都必不可少。 自动驾驶离不开感知层、控制层和执行层的相互配合。摄像头、雷达等传感器获取图像、距离、速度等信息,扮演眼睛、耳朵的角色。 控制模块分析处理信息,并进行
阅读全文
摘要:3D点云完美匹配 The Perfect Match: 3D Point Cloud Matching with Smoothed Densities 地址链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/Gojcic_The_Per
阅读全文
摘要:Geo-CNN的三维点云 Modeling Local Geometric Structure of 3D Point Clouds using Geo-CNN 摘要 深度卷积神经网络(CNNs)的最新进展促使研究人员采用CNNs直接对三维点云中的点进行建模。局部结构的建模已经被证明是卷积结构成功的
阅读全文
摘要:3D点云几何拟合 Supervised Fitting of Geometric Primitives to 3D Point Clouds 论文地址: http://openaccess.thecvf.com/content_CVPR_2019/papers/Li_Supervised_Fitti
阅读全文
摘要:BAD SLAM:捆绑束调整直接RGB-D SLAM BAD SLAM: Bundle Adjusted Direct RGB-D SLAM 论文地址: http://openaccess.thecvf.com/content_CVPR_2019/papers/Schops_BAD_SLAM_Bun
阅读全文
摘要:三维视觉惯性SLAM的有效Schmidt-EKF An Efficient Schmidt-EKF for 3D Visual-Inertial SLAM 论文地址: http://openaccess.thecvf.com/content_CVPR_2019/papers/Geneva_An_Eff
阅读全文
摘要:RGB-D相机视觉SLAM Dense Visual SLAM for RGB-D Cameras 开源代码地址: vision.in.tum.de/data/software/dvo 摘要 本文提出了一种用于RGB-D相机的稠密视觉SLAM方法,该方法可以使所有像素上的光度误差和深度误差最小化。与
阅读全文
摘要:Visual SLAM 追求直接SLAM技术,而不是使用关键点,直接操作图像强度的跟踪和映射。 作为直接方法,LSD-SLAM使用图像中的所有信息,包括边缘,而基于关键点的方法只能在拐角处使用小块。这将导致在纹理稀疏的环境(如室内)中获得更高的精度和更强的鲁棒性,以及更密集的三维重建。此外,由于提出
阅读全文
摘要:3D-LiDAR 结合光学+激光扫描+数据处理技术,实现对人和物体的无盲点检测。 利用专有光学技术实现高精度,高分辨率三维扫描。 到目前为止,传感器只能准确地检测出物体的存在,而且很难感知目标的大小和形状。为了提高精度,必须增加激光器的数量,这就产生了激光束之间出现盲点的新问题。将其专有的光学技术应
阅读全文
摘要:YOLOV4各个创新功能模块技术分析(三) 八.数据增强相关-Stylized-ImageNet 论文名称:ImageNet-trained cnns are biased towards texture; increasing shape bias improves accuracy and ro
阅读全文
摘要:YOLOV4各个创新功能模块技术分析(二) 四.数据增强相关-GridMask Data Augmentation 论文名称:GridMask Data Augmentation 论文地址:https://arxiv.org/abs/2001.04086v2 论文摘要 本文提出了一种新的数据增强方法
阅读全文
摘要:YOLOV4各个创新功能模块技术分析(一) 简 介 yolov4论文:YOLOv4: Optimal Speed and Accuracy of Object Detection arxiv:https://arxiv.org/abs/2004.10934 github源码:https://gith
阅读全文
摘要:虚拟几何纹理(下) 几何纹理既可以与底曲面相加得到阳刻浮雕,也可以与底曲面几何相减得到阴刻,如图10和11所示, 图10. 马头的颜色纹理,几何纹理。 图11. 阳刻几何纹理,阴刻几何纹理【4】。 同样,可以将龙或者玫瑰曲面制成几何图像,从而转换成几何纹理,做成三维刺青,如图12所示, 图12. 三
阅读全文
摘要:虚拟几何纹理(上) 关于几何学 麻省理工人工智能实验室学习Berthold Horn教授的“机器视觉”课程。Horn教授以“shape from shading”方法驰名天下,他在课堂上亲口讲授了如何用偏微分方程来描述成像过程,通过求解双曲方程来从图像反解几何。他提出用高斯曲率来表示凸曲面的扩展高斯
阅读全文
摘要:语义分割:基于openCV和深度学习(二) Semantic segmentation in images with OpenCV 开始吧-打开segment.py归档并插入以下代码: Semantic segmentation with OpenCV and deep learning # imp
阅读全文
摘要:语义分割:基于openCV和深度学习(一) Semantic segmentation with OpenCV and deep learning 介绍如何使用OpenCV、深度学习和ENet架构执行语义分段。阅读完今天的文章后,能够使用OpenCV对图像和视频应用语义分割。深度学习有助于提高计算机
阅读全文
摘要:语义分割 Semantic Segmentation 什么是语义分割
阅读全文
摘要:如何估算各种物体的重心 摘要 本文介绍了一种增强学习算法,该算法通过机器人操作来学习物理材料组成未知的任意物体的质心。机器人学习是通过一系列动作来操纵对象。该算法的有效性在仿真中得到了证明,它可以定位形状复杂,质量分布均匀或不均匀的岩石的质心,并通过在模拟和实际实验中沿沿其学习的质心垂直堆叠岩石来证
阅读全文
摘要:RGB-D对红外热像仪和毫米波雷达标定 Extrinsic Calibration of Thermal IR Camera and mmWave Radar by Exploiting Depth from RGB-D Camera 摘要 尽管RGB相机和激光雷达用途广泛,但据报道,在低能见度的环
阅读全文
摘要:ADAS虚拟车道边界生成 Virtual Lane Boundary Generation for Human-Compatible Autonomous Driving: A Tight Coupling between Perception and Planning 论文地址: http://f
阅读全文
摘要:3D惯导Lidar SLAM LIPS: LiDAR-Inertial 3D Plane SLAM 摘要 本文提出了最近点平面表示的形式化方法,并分析了其在三维室内同步定位与映射中的应用。提出了一个利用最近点平面表示的无奇异平面因子,并在基于图的优化框架中证明了它与惯性预积测量的融合。所得到的LiD
阅读全文
摘要:语义分割改进:通过视频传播和标签松弛 Improving Semantic Segmentation via Video Propagation and Label Relaxation 论文地址:https://arxiv.org/abs/1812.01593 摘要 本文提出了一个视频预测-以方法
阅读全文
摘要:YOLOv4:目标检测(windows和Linux下Darknet 版本)实施 YOLOv4 - Neural Networks for Object Detection (Windows and Linux version of Darknet ) YOLOv4论文链接:https://arxiv
阅读全文
摘要:tensorflow-yolov4实施方法 tensorflow-yolov4-tflite YOLOv4: Optimal Speed and Accuracy of Object Detection 文献链接:https://arxiv.org/abs/2004.10934 代码链接:https
阅读全文
摘要:3D惯导Lidar仿真 LiDAR-Inertial 3D Plane Simulator 摘要 提出了最近点平面表示的形式化方法,并分析了其在三维室内同步定位与映射中的应用。提出了一个利用最近点平面表示的无奇异平面因子,并在基于图的优化框架中证明了它与惯性预积测量的融合。所得到的LiDAR惯性三维
阅读全文
摘要:YOLOv4实用训练实践 准备工作 推荐使用Ubuntu 18.04 CMake >= 3.8: https://cmake.org/download/ CUDA >= 10.0: https://developer.nvidia.com/cuda-toolkit-archive OpenCV >=
阅读全文
摘要:摄像头硬件组成模块 一.概述 摄像头可分为数字摄像头和模拟摄像头两大类。数字摄像头可以将视频采集设备产生的模拟视频信号转换成数字信号,进而将其储存在计算机里。模拟摄像头捕捉到的视频信号必须经过特定的视频捕捉卡将模拟信号转换成数字模式,并加以压缩后才可以转换到计算机上运用。数字摄像头可以直接捕捉影像,
阅读全文
摘要:Bayer滤镜如何转换颜色? Bayer模式是颜色模式,被广泛应用于CCD和CMOS摄像头。相机使用了拜耳滤镜,分别过滤得到红绿蓝三种颜色。既然要得到的是红绿蓝频段光线的强度,要通过的就是红绿蓝光,就反射了其他频段的光线。 比如说红色滤镜应该是 反射 了除去红色那一个波段的其他光。这里有一个疑问:它
阅读全文
摘要:ISP_DPC坏点矫正 1. 坏点介绍 图像坏点(Bad pixel) : 图像传感器上光线采集点(像素点)所形成的阵列存在工艺上的缺陷,或光信号进行转化为电信号的过程中出现错误,从而会造成图像上像素信息错误,导致图像中的像素值不准确,这些有缺陷的像素即为图像坏点。 由于来自不同工艺技术和传感器制造
阅读全文
摘要:ISP算法高水平分析(下) 十.LSC(Lens Shade Correction) 镜头阴影矫正 Lens Shading指画面四角由于入射光线不足形成的暗角,同时,由于不同频率的光折射率差别,导致 color shading。因此需要镜头影音校正(Lens Shading Correction)
阅读全文
摘要:ISP算法高水平分析(上) 一.ISP基本框架及算法介绍 ISP是Image Signal Processor的缩写,全称是影像处理器。在相机成像的整个环节中,它负责接收感光元件(Sensor)的原始信号数据,可以理解为整个相机拍照、录像的第一步处理流程,对图像质量起着非常重要的作用。 ISP的功能
阅读全文
摘要:长篇自动驾驶技术综述论文(下) 三维目标检测 鉴于经济性,可用性和研究的广泛性,几乎所有的算法都使用相机作为主要的感知方式。把相机应用在ADS中,限制条件除了前面讨论到的光照等因素外,还有一个问题就是目标检测是在图像空间的,忽略了场景的尺度信息。而当需要进行避障等动态驾驶任务时,我们需要将二维图像映
阅读全文
摘要:长篇自动驾驶技术综述论文(上) A Survey of Autonomous Driving: Common Practices and Emerging Technologies Ekim Yurtsever, Jacob Lambert, Alexander Carballo, Kazuya T
阅读全文
摘要:常用语义分割小样本模型 1.介绍 深度卷积神经网络在图像分类、目标检测、语义分割等许多视觉理解任务上都取得了重大突破。一个关键的原因是大规模数据集的可用性,比如ImageNet,这些数据集支持对深度模型的培训。然而,数据标记是昂贵的,特别是对于密集的预测任务,如语义分割和实例分割。此外,在对模型进行
阅读全文
摘要:Gamma矫正技术 一. gamma校正背景 在电视和图形监视器中,显像管发生的电子束及其生成的图像亮度并不是随显像管的输入电压线性变化,电子流与输入电压相比是按照指数曲线变化的,输入电压的指数要大于电子束的指数。这说明暗区的信号要比实际情况更暗,而亮区要比实际情况更高。所以,要重现摄像机拍摄的画面
阅读全文
摘要:相机自动对焦AF原理 AF性能是判断相机好坏的重要指标,主要从准确度和速度两个方面来进行考察,本文将介绍自动对焦的几种方式。 一.凸透镜成像原理 二.三种对焦方法 有公式在手,只要给相机安个测距仪就好了,测距仪的精度越高对焦就越准,成像就越清晰,在这种想法的驱动下,主动式对焦就应运而生了,在大部分不
阅读全文
摘要:摄像头ISP系统原理(下) l WDR(Wide Dynamic Range) 宽动态 动态范围(Dynamic Range)是指摄像机支持的最大输出信号和最小输出信号的比值,或者说图像最亮部分与最暗部分的灰度比值。普通摄像机的动态范围一般在1:1000(60db)左右,而宽动态(Wide Dyna
阅读全文
摘要:摄像头ISP系统原理(中) AF(FOCUS) 自动对焦 根据光学知识,景物在传感器上成像最清晰时处于合焦平面上。通过更改 LENS 的位置,使得景物在传感器上清晰的成像,是 ISP FOCUS 功能所需要完成的任务。FOCUS 分为手动和自动两种模式。ISP 可以运行 CONTRAST AF、PD
阅读全文
摘要:摄像头ISP系统原理(上) ISP(Image Signal Processor),即图像信号处理器,用于处理图像信号传感器输出的图像信号。它在相机系统中占有核心主导的地位,是构成相机的重要设备。 主要内部构成 如下图所示,ISP 内部包含 CPU、SUP IP、IF 等设备,事实上,可以认为 IS
阅读全文
摘要:目标检测中特征融合技术(YOLO v4)(下) ASFF:自适应特征融合方式 ASFF来自论文:《Learning Spatial Fusion for Single-Shot Object Detection》,也就是著名的yolov3-asff。 金字塔特征表示法(FPN)是解决目标检测尺度变化
阅读全文
摘要:目标检测中特征融合技术(YOLO v4)(上) 论文链接:https://arxiv.org/abs/1612.03144 Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollár, Ross Girshick,
阅读全文
摘要:行人检测与重识别!SOTA算法 A Simple Baseline for Multi-Object Tracking, Yifu Zhang, Chunyu Wang, Xinggang Wang, Wenjun Zeng, Wenyu Liu, 论文地址:https://arxiv.org/pd
阅读全文
摘要:最佳点云分割分析 Learning to Optimally Segment Point Clouds 论文链接:https://arxiv.org/abs/1912.04976 摘要 我们关注LiDAR点云的无类实例分割问题。我们提出了一种将图论搜索与数据驱动的学习相结合的方法:在一组候选分割中搜
阅读全文
摘要:高动态范围(High-Dynamic Range,简称HDR) 一.HDR介绍 高动态范围(High-Dynamic Range,简称HDR),又称宽动态范围技术,是在非常强烈的对比下让摄像机看到影像的特色而运用的一种技术。 当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较
阅读全文
摘要:3D车道线检测:Gen-LaneNet Gen-LaneNet: A Generalized and Scalable Approach for 3D Lane Detection 论文链接:https://arxiv.org/abs/2003.10656 摘要 提出了一种广义的、可扩展的方法,称为
阅读全文
摘要:第四代自动泊车从APA到AVP技术 前言 自动泊车是指汽车自动泊车入位不需要人工控制,系统能够自动帮你将车辆停入车位,在倒车入库中可谓是驾驶者的一项利器。当我们找到一个理想的停车地点,只需轻轻启动按钮、坐定、放松,其他一切即可自动完成。自动泊车技术同样适用于主动避撞系统,并最终实现汽车的自动驾驶。
阅读全文
摘要:YOLO、SSD、FPN、Mask-RCNN检测模型对比 一.YOLO(you only look once) YOLO 属于回归系列的目标检测方法,与滑窗和后续区域划分的检测方法不同,他把检测任务当做一个regression问题来处理,使用一个神经网络,直接从一整张图像来预测出bounding b
阅读全文
摘要:RCNN系列、Fast-RCNN、Faster-RCNN、R-FCN检测模型对比 一.RCNN 问题一:速度 经典的目标检测算法使用滑动窗法依次判断所有可能的区域。本文则预先提取一系列较可能是物体的候选区域,之后仅在这些候选区域上提取特征,进行判断。 问题二:训练集 经典的目标检测算法在区域中提取人
阅读全文
摘要:虚拟纹理与几何图像技术 一. 基本图形学概念 图1. 几何与纹理。 曲面一般表示成三角网格和纹理图像,三角网格表示曲面的几何拓扑信息,纹理图像给出曲面的颜色材质等信息。将三角网格映射到平面区域的过程被称为曲面参数化,将纹理图像贴合到曲面上被称为纹理贴图。图1显示了一张人脸曲面的三角网格、纹理图像;图
阅读全文
摘要:深度学习与传统图像识别 概述 传统方法中特征提取主要依赖人工设计的提取器,需要有专业知识及复杂的调参过程,同时每个方法都是针对具体应用,泛化能力及鲁棒性较差。 深度学习主要是数据驱动进行特征提取,根据大量样本的学习能够得到深层的、数据集特定的特征表示,其对数据集的表达更高效和准确,所提取的抽象特征鲁
阅读全文
摘要:ASML光刻机PK 原子弹,难度? 一. 物理世界和网络世界的交汇点:光刻机 光刻机的技术有多高级,看看这个知乎提问,可以感受一下: 有人这样形容光刻机:这是一种集合了数学、光学、流体力学、高分子物理与化学、表面物理与化学、精密仪器、机械、自动化、软件、图像识别领域顶尖技术的产物。 它大概长这样。
阅读全文
摘要:L4自动驾驶技术 一.SAE的五个级别分别是: L0:驾驶员完全掌控车辆,无任何自动化能力。 L1:自动系统有时能够辅助驾驶员完成某些驾驶任务。比如高速自动巡航(自动认知所在车道),和一些驾驶辅助功能等等。 L2:自动系统能够完成某些驾驶任务,但驾驶员需要监控驾驶环境,完成剩余部分,同时保证出现问题
阅读全文
摘要:单目摄像头标定与测距 一、 标定 首先要对摄像头做标定,具体的公式推导在learning opencv中有详细的解释,这里顺带提一句,这本书虽然确实老,但有些理论、算法类的东西里面还是讲的很不错的,必要的时候可以去看看。 1.单目摄像头标定 标定的目的是为了消除畸变以及得到内外参数矩阵,内参数矩阵可
阅读全文
摘要:多传感器融合理论 多传感器信息融合(Multi-sensor Information Fusion,MSIF),就是利用计算机技术将来自多传感器或多源的信息和数据,在一定的准则下加以自动分析和综合,以完成所需要的决策和估计而进行的信息处理过程。 一、多传感器融合几个概念 硬件同步、硬同步:使用同一种
阅读全文
摘要:中国摄像头CMOS需求潜力旺盛 CMOS是Complementary Metal Oxide Semiconductor(互补金属氧化物半导体)的缩写。它是指制造大规模集成电路芯片用的一种技术或用这种技术制造出来的芯片,是电脑主板上的一块可读写的RAM芯片。因为可读写的特性,所以在电脑主板上用来保存
阅读全文
摘要:智能座舱技术预测 智能座舱概念 多屏联动、智能表面、自动驾驶、新材料、情感引擎正在迅速普及到中高端豪华电动车型中,智能座舱的下一个十年,更多数字化技术将会完美融入到智能座舱中,智能座舱也势会以更全新的形式呈现出来! 电动化、智能化、网联化、共享化成为汽车行业未来发展趋势,已经成为行业共识。这些趋势将
阅读全文
摘要:FCN与U-Net语义分割算法 图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环,也是 AI 领域中一个重要的分支。语义分割即是对图像中每一个像素点进行分类,确定每个点的类别(如属于背景、人或车等),从而进行区域划分。目前,语义分割已经被广
阅读全文
摘要:单目测距算法 相似三角形 用相似三角形计算物体或者目标到相机的距离,将使用相似三角形来计算相机到一个已知的物体或者目标的距离。 假设有一个宽度为 W 的目标或者物体。然后将这个目标放在距离的相机为 D 的位置。用相机对物体进行拍照并且测量物体的像素宽度 P。 这样就得出了相机焦距的公式: F = (
阅读全文
摘要:目标跟踪算法 一.互相关运算 给你一张我的正脸照(没有经过美颜处理的),你该如何在人群中找到我呢?一种最直观的方案就是:“谁长得最像就是谁”。但是对于计算机来说,如何衡量“长得像”,并不是个简单的问题。这就涉及一种基本的运算——互相关(cross-correlation)。互相关运算可以用来度量两个
阅读全文
摘要:MAML-Tracker: 目标跟踪分析:CVPR 2020(Oral) Tracking by Instance Detection: A Meta-Learning Approach 论文链接:https://arxiv.org/abs/2004.00830 摘要 把跟踪问题看作一类特殊的目标检
阅读全文
摘要:深度学习模型轻量化(下) 2.4 蒸馏 2.4.1 蒸馏流程 蒸馏本质是student对teacher的拟合,从teacher中汲取养分,学到知识,不仅仅可以用到模型压缩和加速中。蒸馏常见流程如下图所示 1. 老师和学生可以是不同的网络结构,比如BERT蒸馏到BiLSTM网络。但一般相似网络结构,蒸
阅读全文
摘要:深度学习模型轻量化(上) 移动端模型必须满足模型尺寸小、计算复杂度低、电池耗电量低、下发更新部署灵活等条件。 模型压缩和加速是两个不同的话题,有时候压缩并不一定能带来加速的效果,有时候又是相辅相成的。压缩重点在于减少网络参数量,加速则侧重在降低计算复杂度、提升并行能力等。模型压缩和加速可以从多个角度
阅读全文
摘要:智能驾驶开发的几个问题 1. 当前市场上的摄像头产品经常存在近距离静止目标不识别和输出的车道线方程系数动态波动较大,请问导致该问题的原因您觉得是什么,该如何来解决? 近距离检测问题 1)FOV视场角太小 2)帧率太低 3)增加样本数据 波动问题 1)深度学习网络模型太小,增加车道线网络模型层数,修改
阅读全文
摘要:人工智能算法研发方向跟踪 1. CVPR2020国际会议研究论文方向 CNN 图像分类 目标检测 3D目标检测 视频目标检测 目标跟踪 语义分割 实例分割 全景分割 视频目标分割 超像素分割 NAS GAN Re-ID 3D点云(分类/分割/配准等) 人脸(识别/检测/重建等) 人体姿态估计(2D/
阅读全文
摘要:四种软件架构 一.ISP架构 二.阿里云大数据架构 三.今日头条推荐算法架构 推荐系统,如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数,这个函数需要输入三个维度的变量。 第一个维度是内容。头条现在已经是一个综合内容平台,图文、视频、UGC小视频、问答、微头条,每种内容有很多自己的特征
阅读全文
摘要:未来几年自动驾驶预测(下) 四.各地政府越来越关注自动驾驶技术,未来与相关企业探索多种合作模式 ▏自动驾驶发展道路上,政府地位至关重要 纵观历史,诸多新兴行业在早期发展阶段,都需要政府的大力扶持,为行业做一次“冷启动”,自动驾驶这项新兴技术也不例外。 毕马威在2018年1月发布的《自动驾驶汽车成熟度
阅读全文
摘要:未来几年自动驾驶预测(上) 自动驾驶汽车依靠5G、人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。近年来全球汽车行业达成共识,认为自动驾驶代表了未来汽车行业的发展方向。实现自动驾驶是一个渐进过程,目前国际通用的自动驾驶标准根据自
阅读全文
摘要:几种软件架构 一.阿里云大数据架构 二.今日头条推荐算法架构 推荐系统,如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数,这个函数需要输入三个维度的变量。第一个维度是内容。头条现在已经是一个综合内容平台,图文、视频、UGC小视频、问答、微头条,每种内容有很多自己的特征,需要考虑怎样提取
阅读全文
摘要:图像零交叉点,视频生成,视频识别,视频摘要,视频浓缩 一.视频生成,视频识别,视频摘要,视频浓缩 视频生成与视频识别 视频分析的两大任务,前者侧重于对下一帧的预测,而前者则侧重于视频内容的理解。由于视频是由一系列的视频帧组成的,那么如果有大量的视频数据,通过分析视频中动态场景的变化情况,就可以合成出
阅读全文
摘要:深度学习调参体验(二) 1. 激活函数选择: 常用的激活函数有relu、leaky-relu、sigmoid、tanh等。对于输出层,多分类任务选用softmax输出,二分类任务选用sigmoid输出,回归任务选用线性输出。而对于中间隐层,则优先选择relu激活函数(relu激活函数可以有效的解决s
阅读全文
摘要:深度学习调参体验(一) 基本原则: 快速试错 一.一些大的注意事项: 1.先上小规模数据, 模型往大了放, 只要不爆显存, 能用256个filter就别用128个。直接奔着过拟合去。就是训练过拟合网络, 连测试集验证集这些都可以不用。 为什么? 要验证自己的训练脚本的流程对不对。这一步小数据量, 生
阅读全文
摘要:C/C++语言编程的隐患! 本文将带您了解一些良好的和内存相关的编码实践,以将内存错误保持在控制范围内。内存错误是 C 和 C++ 编程的祸根:它们很普遍,认识其严重性已有二十多年,但始终没有彻底解决,它们可能严重影响应用程序,并且很少有开发团队对其制定明确的管理计划。但好消息是,它们并不怎么神秘。
阅读全文
摘要:高精度定位理论及应用 从移动互联到物联网,位置是一个基础的不可或缺的信息,但是从精细化的行业应用需求来说,只有更高精度的定位信息才能带来更高的价值,人们可以更加精确地知道事物所处的位置,知道人员具体位置在哪儿,更好的管理企业、人员或物资。比如说保障隧道施工人员人身安全,协助监狱搭建全局化、可视化的监
阅读全文
摘要:Git 快速控制 聊聊学习 Git 那些事 现在回想起来,其实接触 Git 的时候是在大一的时候表哥带入门的。当时因为需要做一个项目,所以他教如何使用 Git 将写好的代码推送到 GitHub 上,然后再从远程仓库拉到本地。起初因为没有接触过 Git,觉得这玩意很难学,又是一大堆命令需要记忆,在他教
阅读全文
摘要:YOLOvi(i=1,2,3,4)系列 YOLOv4论文链接:https://arxiv.org/pdf/2004.10934.pdf YOLOv4源码链接:https://github.com/AlexeyAB/darknet YOLO 系列算法是目标检测 one-stage 类的代表算法,本文将
阅读全文
摘要:Mask-RCNN技术解析 MaskR-CNN 论文链接:https://arxiv.org/pdf/1703.06870.pdf 代码链接:https://github.com/CharlesShang/FastMaskRCNN 摘要 提出了一个概念简单,灵活,通用的对象实例分割框架。本方法有效地
阅读全文
摘要:汽车HUD(Head-up Display)的技术难点 首先解析一下HUD是什么原理吧。其实就是把车的前挡风玻璃当成反射镜,在驾驶员人眼前投射一个仪表盘的虚像。图像本身来自下方的电子发光屏,发出仪表盘的图形。 HUD显示的车辆信息内容有行车速度、自适应巡航功能、变道辅助功能、导航功能、夜视系统开启标
阅读全文
摘要:MPC算法 一. 引言 在工程技术方面,MPC全称可指Model Predictive Control模型预测控制(又称RHC, Receding Horizon )。 模型预测控制算法 一种进阶过程控制方法,自1980年以来开始在化工炼油等过程工业得到应用,并在经济领域开始得到应用。 MPC是一种
阅读全文
摘要:车载智能HUD 从 HUD 到行车记录仪再到后视镜,最近有不少团队都发布了自己的车载智能硬件。 什么是 HUD? HUD 全称抬头数字显示仪 (Heads Up Display),又叫平视显示系统,简称HUD。可以把重要的信息,映射在玻璃上,使驾驶员不必低头就能看清重要的信息,最早出现在军用战斗机。
阅读全文
摘要:TOF与结构光技术分析 一.概述 结构光(Structuredlight),通常采用特定波长的不可见的激光作为光源,它发射出来的光带有编码信息,投射在物体上,通过一定算法来计算返回的编码图案的畸变来得到物体的位置和深度信息。 光飞行时间法(TOF),利用测量光飞行时间来取得距离,简单来说就是,发出一
阅读全文
摘要:CVPR 2020目标跟踪多篇开源论文(下) 6. Cooling-Shrinking Attack: Blinding the Tracker with Imperceptible Noises 作者团队:大连理工大学(卢湖川组)&鹏城实验室等 论文链接:https://arxiv.org/abs
阅读全文
摘要:CVPR 2020目标跟踪多篇开源论文(上) 1. SiamBAN:面向目标跟踪的Siamese Box自适应网络 作者团队:华侨大学&中科院&哈工大&鹏城实验室&厦门大学等 论文链接:https://arxiv.org/abs/2003.06761 代码链接:https://github.com/
阅读全文
摘要:智能驾驶L2发展策略 智能驾驶L2,以们通俗的定义是,以高级辅助驾驶的产品为主的各种巡航产品,包括定速巡航,自适应巡航ACC,预见性巡航,智能巡航等等。 车辆驾驶是集注意力高度集中,手把控方向盘和换挡,脚负责刹车油门的一些列综合协调的操作,那么驾驶久了必然会精力和身体疲劳,但由于L2或者高级辅助驾驶
阅读全文
摘要:单目测距几个关键点 一.畸变矫正 相机镜头畸变矫正-->得到相机的内外参数、畸变参数矩阵 1. 外参数矩阵。世界坐标经过旋转和平移,然后落到另一个现实世界点(摄像机坐标)上。 2. 内参数矩阵。告诉你上述那个点在1的基础上,是如何继续经过摄像机的镜头、并通过针孔成像和电子转化而成为像素点的。 3.
阅读全文
摘要:智能交通监控 一. 功能模块 高清交通摄像机,高清卡口解决方案,闯红灯抓拍系统,平安城市建设解决方案,智慧城市监控系统,抓拍车牌摄像机,停车场车牌识别系统,高速公路雷达测速,车牌识别摄像机,智能交通高清摄像机,电警摄像机,闯红灯电警摄像机,治安卡口摄像机,道闸监控摄像机,收费站摄像机,雷达测速抓拍,
阅读全文
摘要:YOLOV4知识点分析(二) 6. 数据增强相关-mixup 论文名称:mixup: BEYOND EMPIRICAL RISK MINIMIZATION 论文地址:https://arxiv.org/abs/1710.09412 mixup由于非常有名,大家都应该知道,而且网上各种解答非常多,故这
阅读全文
摘要:YOLOV4知识点分析(一) 简 介 yolov4论文:YOLOv4: Optimal Speed and Accuracy of Object Detection arxiv:https://arxiv.org/abs/2004.10934 github源码:https://github.com/
阅读全文
摘要:图像角点检测 一.关于角点的具体描述可以有几种: (1)、一阶导数(即灰度的梯度)的局部最大所对应的像素点; (2)、两条及两条以上边缘的交点; (3)、图像中梯度值和梯度方向的变化速率都很高的点; (4)、角点处的一阶导数最大,二阶导数为零,指示物体边缘变化不连续的方向。 二.近年来提出的角点检测
阅读全文
摘要:计算机视觉解析力 视觉的解析力,常常是指视觉语义,视觉特征,视觉场景理解,视觉目标检测,视觉变化,视觉运动状态理解等等。 比如说,关于分辨率和清晰度,经常还可以见到清晰度,分辨力,分辨率,解析力,解析度,解像力,解像度这些词语。对于这些词语分别的含义和所指的具体内容是什么,怎样使用才合适,目前流行的
阅读全文
摘要:空间点像素索引(三) 1. 点与坐标轴点相互转换 在 S2 算法中,默认划分 Cell 的等级是30,也就是说把一个正方形划分为 2^30 * 2^30个小的正方形。那么上一步的s,t映射到这个正方形上面来,对应该如何转换呢? s,t的值域是[0,1],现在值域要扩大到[0,2^30^-1]。 //
阅读全文
摘要:空间点像素索引(二) 三. Hilbert Curve 希尔伯特曲线 1. 希尔伯特曲线的定义 希尔伯特曲线一种能填充满一个平面正方形的分形曲线(空间填充曲线),由大卫·希尔伯特在1891年提出。由于它能填满平面,它的豪斯多夫维是2。取它填充的正方形的边长为1,第n步的希尔伯特曲线的长度是2^n -
阅读全文
摘要:空间点像素索引(一) 给你一个需求,查找定位点附近的一定范围内所有餐馆,你会怎么实现呢? 一一计算定位点与所有餐馆的距离,然后取出最小的距离?如果同时有很多遍布全国的请求都在查找附近的餐馆,按照上述的做法,你的服务有能力及时响应么?本文介绍了两种高效的空间点查找方法,并且该方法在打车领域和地图领域有
阅读全文
摘要:相机标定实用方案 相机标定就是确定相机内参和外参的过程,其结果精度会直接影响视觉系统后续工作的准确性。 一.OPENCV方法 在opencv中提供了一组函数用于实现相机的标定,标定返回的值包括:相机内参矩阵(fx fy xc yc)、相机外参矩阵(R t)以及畸变矩阵。 标定的步骤如下: 1. 准备
阅读全文
摘要:摄像头的主要参数 1. 摄像头参数是三种不同的参数。 1)摄像头的内参数是六个分别为:1/dx、1/dy、r、u0、v0、f。 opencv1里的说内参数是4个其为fx、fy、u0、v0。实际其fx=F*Sx,其中的F就是焦距上面的f,Sx是像素/没毫米即上面的dx,其是最后面图里的后两个矩阵进行先
阅读全文
摘要:多篇开源CVPR 2020 语义分割论文 前言 1. DynamicRouting:针对语义分割的动态路径选择网络 Learning Dynamic Routing for Semantic Segmentation 作者团队:中科院&国科大&西安交大&旷视 论文链接:https://arxiv.o
阅读全文
摘要:深度学习可形变卷积 Deformable Convolutional Networks 参考文献链接:https://arxiv.org/pdf/1703.06211.pdf 参考代码链接: https://github.com/ msracver/Deformable-ConvNets 可形变卷积
阅读全文
摘要:Google Pixel 超分辨率--Super Resolution Zoom Google 的Super Res Zoom技术,主要用于在zoom时增强画面细节以及提升在夜景下的效果。 文章的主要贡献有: · 使用多帧图像超分辨算法代替去马赛克算法 · 引入自适应核插值和融合算法。其自适应于图像
阅读全文
摘要:YOLO v1到YOLO v4(下) Faster YOLO使用的是GoogleLeNet,比VGG-16快,YOLO完成一次前向过程只用8.52 billion 运算,而VGG-16要30.69billion,但是YOLO精度稍低于VGG-16。 Draknet19 YOLO v2基于一个新的分类
阅读全文
摘要:YOLO v1到YOLO v4(上) 一. YOLO v1 这是继RCNN,fast-RCNN和faster-RCNN之后,rbg(RossGirshick)针对DL目标检测速度问题提出的另外一种框架。YOLO V1其增强版本GPU中能跑45fps,简化版本155fps。 论文下载:http://a
阅读全文
摘要:操作系统常用词典(三) 129. 电阻式触摸屏(Resistive touchscreens):电阻式触摸屏基于施加到屏幕上的压力来工作。电阻屏由许多层组成。当按下屏幕时,外部的后面板将被推到下一层,下一层会感觉到施加了压力并记录了输入。电阻式触摸屏用途广泛,可以用手指,指甲,手写笔或任何其他物体进
阅读全文
摘要:操作系统常用词典(二) 65. USB(Universal Serial Bus):是连接计算机系统与外部设备的一种串口总线标准,也是一种输入输出接口的技术规范,被广泛地应用于个人电脑和移动设备等信息通讯产品,并扩展至摄影器材、数字电视(机顶盒)、游戏机等其它相关领域。 66. BIOS(Basic
阅读全文
摘要:操作系统常用词典(一) 1. 操作系统(Operating System,OS):是管理计算机硬件与软件资源的系统软件,同时也是计算机系统的内核与基石。操作系统需要处理管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互
阅读全文
摘要:CPU性能PK AMD vs Intel 2020: Who Makes the Best CPUs? 英文原文链接:https://www.tomshardware.com/features/amd-vs-intel-cpus 如果正在寻找最好的游戏CPU或桌面应用程序的最佳CPU,只有两个选择:
阅读全文
摘要:阿里图像检索规则 描述 业务接口:/green/image/scan 关于图片的限制 · 图片链接支持以下协议:HTTP和HTTPS。 · 图片支持以下格式:PNG、JPG、JPEG、BMP、GIF、WEBP。 · 图片大小限制为10MB以内。如您有特殊需求(大图片),可以提工单进行调整。 · 图片
阅读全文
摘要:Mobileye 自动驾驶策略(二) 与多方都成功进行了合作,其中比较大型的合作包括法雷奥、百度和中国 ITS。 法雷奥是最近的的 Tier 1 合作伙伴,法雷奥和 Mobileye 签署协议,表示未来会将 RSS 加入其自动驾驶研发项目并联合其他工业标准一起使用并同意共同制定行业标准。 与百度签署
阅读全文
摘要:Mobileye 自动驾驶策略(一) 详解 Mobileye 自动驾驶解决方案 Mobileye的自动驾驶解决方案。总得来说,分为四种: Visual perception and sensor fusion(视觉感知和感知融合) Compute platform(计算平台) Driving pol
阅读全文
摘要:ARM NEON指令集优化理论与实践 一.简介 NEON就是一种基于SIMD思想的ARM技术,相比于ARMv6或之前的架构,NEON结合了64-bit和128-bit的SIMD指令集,提供128-bit宽的向量运算(vector operations)。NEON技术从ARMv7开始被采用,目前可以在
阅读全文
摘要:小样本学习综述 数据是机器学习领域的重要资源,在数据缺少的情况下如何训练模型呢?小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展,并提出了未来的研究方向。 这篇综述论文已被 ACM Computing Surveys 接收,作者还建立了 GitHub repo
阅读全文
摘要:如何评估两张图片的差异 方法一,图像直方图比较 就像人的指纹一样,没有哪两张的照片的直方图会是一样的(拍摄的图片),所以只要将两张图片拉倒ps里面看直方图就可以了。 方法二,DiffImg 方法三,Image Comparer 方法四,Beyond Compare 这三个都是比较好的图片来对比工具,
阅读全文
摘要:网络模型mAP计算实现代码 一、mAP精度计算 这里首先介绍几个常见的模型评价术语,现在假设我们的分类目标只有两类,计为正例(positive)和负例(negtive)分别是: 1)True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);
阅读全文
摘要:Python脚本语言写法 脚本语言的开始行,是指文件中的代码用什么可执行程序去运行它,就这么简单。 #!/usr/bin/python是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器; #!/usr/bin/env python这种用法是为了防止操作系统用户没有将pyth
阅读全文
摘要:机器学习算法的优点和缺点总结 1.正则化算法(Regularization Algorithms) 它是另一种方法(通常是回归方法)的拓展,这种方法会基于模型复杂性对其进行惩罚,它喜欢相对简单能够更好的泛化的模型。 例子: 岭回归(Ridge Regression) 最小绝对收缩与选择算子(LASS
阅读全文
摘要:卷积神经网络模型可解释性 缺乏可解释性仍然是在许多应用中采用深层模型的一个关键障碍。在这项工作中,明确地调整了深层模型,这样人类用户可以在很短的时间内完成他们预测背后的过程。具体地说,训练了深度时间序列模型,使得类概率预测具有较高的精度,同时被节点较少的决策树紧密地建模。使用直观的玩具例子以及治疗白
阅读全文
摘要:深度学习11个实用技巧 深度学习工程师George Seif发表了一篇博文,总结了7个深度学习的技巧,本文增加了几个技巧,总结了11个深度学习的技巧,主要从提高深度学习模型的准确性和速度两个角度来分析这些小技巧。在使用深度学习的时候,我们不能仅仅把它看成一个黑盒子,因为网络设计、训练过程、数据处理等
阅读全文
摘要:深度学习LiDAR定位:L3-Net 摘要 本文提出L3-Net——一种新颖的基于学习的LiDAR定位系统,可实现厘米级的定位,与现有最高水平的传统定位算法相媲美。与传统定位算法不同,本文创新地实现了使用各种深度神经网络结构来建立基于学习的定位算法。首先,L3-Net会学习专门针对不同现实驾驶场景中
阅读全文
摘要:3D深度估计 Consistent Video Depth Estimation 论文地址:https://arxiv.org/pdf/2004.15021.pdf 项目网站:https://roxanneluo.github.io/Consistent-Video-Depth-Estimation
阅读全文
摘要:深度学习模型训练过程 一.数据准备 1. 基本原则: 1)数据标注前的标签体系设定要合理 2)用于标注的数据集需要无偏、全面、尽可能均衡 3)标注过程要审核 2. 整理数据集 1)将各个标签的数据放于不同的文件夹中,并统计各个标签的数目 2)样本均衡,样本不会绝对均衡,差不多就行了 3)切分样本集
阅读全文
摘要:语义分割模型优化 Improving Semantic Segmentation via Video Propagation and Label Relaxation 链接地址:https://arxiv.org/abs/1812.01593v1 代码链接:https://nv-adlr.githu
阅读全文
摘要:摄像头单目测距原理及实现 一.测距原理 空间的深度或距离等数据的摄像头。 人的眼睛长在头部的前方,两只眼的视野范围重叠,两眼同时看某一物体时,产生的视觉称为双眼视觉。 双眼视觉的优点是可以弥补单眼视野中的盲区缺损,扩大视野,并产生立体视觉。 也就是说,假如只有一只眼睛,失去立体视觉后,人判断距离的能
阅读全文
摘要:2020年Yann Lecun深度学习笔记(下)
阅读全文
摘要:2020年Yann Lecun深度学习笔记(上)
阅读全文
摘要:ARM系统架构 一.ARM概要 ARM架构,曾称进阶精简指令集机器(Advanced RISC Machine)更早称作Acorn RISC Machine,是一个32位精简指令集(RISC)处理器架构。还有基于ARM设计的派生产品,重要产品包括Marvell的XScale架构和德州仪器的OMAP系
阅读全文
摘要:摄像头标定实施 一.标定流程 在opencv中提供了一组函数用于实现相机的标定,标定返回的值包括:相机内参矩阵(fx fy xc yc)、相机外参矩阵(R t)以及畸变矩阵。 标定的步骤如下: 1. 准备棋盘格,棋盘格图片可以自行打印,以下使用10*7方格的棋盘格,交点则为9*6,棋盘格的大小1mm
阅读全文
摘要:特斯拉ADAS Tesla 目前在Model S和Model X上面采用的自动辅助驾驶系统集成了12个超声波传感器,用来识别周围环境: 一个前置摄像头,用来辨识前方物体: 一个前置雷达,用来辨识前方物体: 以及卫星高精度地图: 接下来的部分便十分有趣,Tesla虽然在所有车上面内置了自动辅助驾驶的硬
阅读全文
摘要:相机畸变与标定 一、相机畸变 定义:相机镜头的畸变实际上是光学透镜固有的透视失真的总称。 相机畸变的分类: 1、枕形畸变:又称鞍形形变,视野中边缘区域的放大率远大于光轴中心区域的放大率,常用在远摄镜头中(下图左); 2、桶形畸变,与枕形畸变相反,视野中光轴中心区域的放大率远大于边缘区域的放大率,常出
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(六) 1. Tiny Darknet 听过很多人谈论SqueezeNet。 SqueezeNet很酷,但它只是优化参数计数。当大多数高质量的图像是10MB或更大时,为什么要关心的型号是5MB还是50MB?如果想要一个小模型,实际上很快
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(五) RNNs in Darknet 递归神经网络是表示随时间变化的数据的强大模型。为了更好地介绍RNNs,我强烈推荐Andrej Karpathy去年的博客文章,这是实现RNNs的一个很好的资源! 所有这些模型都使用相同的网络架构,
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(四) Nightmare 从前,在一所大学的大楼里,西蒙尼亚、维达第和齐瑟曼有一个很好的主意,几乎和你现在坐的大楼完全不同。他们想,嘿,我们一直在向前运行这些神经网络,它们工作得很好,为什么不也向后运行呢?这样我们就能知道电脑在想什么
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(三) ImageNet分类 您可以使用Darknet为1000级ImageNet挑战赛分类图像。如果你还没有安装Darknet,你应该先安装。 使用预先训练的模型分类 下面是安装Darknet、下载分类权重文件和在图像上运行分类器的命
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(二) 版本3有什么新功能? YOLOv3使用了一些技巧来改进训练和提高性能,包括:多尺度预测、更好的主干分类器等等。全部细节都在我们的论文上! 使用预先训练的模型进行检测 这篇文章将指导你通过使用一个预先训练好的模型用YOLO系统检测
阅读全文
摘要:AlexeyAB DarkNet YOLOv3框架解析与应用实践(一) Darknet: C语言中的开源神经网络 Darknet是一个用C和CUDA编写的开源神经网络框架。它速度快,易于安装,支持CPU和GPU计算。您可以在GitHub上找到源代码,也可以在这里阅读更多关于Darknet可以做什么的
阅读全文
摘要:车道线检测算法经典编程 1. 车道线曲线拟合算法编程 计算经过(50,50),(90,120),(70,200)三点的Catmull_Rom样条曲线。 1. IplImage* img = cvCreateImage(cvSize(300,300), 8, 1); 2. for (int i = 0
阅读全文
摘要:360度全景视频后视镜 汽车全景摄像头也叫全景泊车。它工作的原理是在车的前杠处的中网位置、后面牌照灯位置、左后视镜下端边缘处、右后视镜边缘处,这四个方位分别安装上广角摄像头,通过图像拼接的方式来采集车辆四周的影像环境,然后通软件处理矫正,在车载设备上显示一幅车辆四周的360度全景的俯视视频影像。 四
阅读全文
摘要:三路摄像头后视系统 “向左,向右,方向盘打死,过了,回一点,倒、倒、倒,再来一点,好,停!”相信各位车主在停车泊位时,都曾受到过这样的“热情招呼”。虽然有时自己觉得都快撞到后面了,人工提示还一如既往地让你“倒”,难免心理打鼓。据统计,由于车后盲区所造成的交通事故在中国约占30%,美国约占20%。难怪
阅读全文
摘要:自动驾驶十字路口解决方案 智能城市出行与交通枢纽,能够改善交通流量,减少污染,并向驶近的网联车辆和行人发送潜在危险信息。 一.大陆集团版智能十字路口 创新:该枢纽有两条智能十字路口,配备了大陆的短程与远程传感器,以及探测司机走错道的系统。该枢纽正在收集非个人识别系统,创建基础设施到一切(I2X)通信
阅读全文
摘要:交通信号灯检测与行人过马路策略 一.概述 在智能交通领域关于交通标志,车道线,车辆前向碰撞预警,后向碰撞预警,车距检测等已经有比较广泛的研究。这些交通相关的计算机视觉方向也是目前自动驾驶汽车正在解决或者已经解决的经典问题。相比于这几个方向,对于交通灯的检测的研究相对较少。交通灯的检测在自动驾驶汽车的
阅读全文
摘要:自动泊车相关的技术 一.常用自动泊车技术 现有的自动泊车相关的技术主要有几种: 利用超声波传感器提示停车距离的「停车距离警报系统」; 只有转向自动化的「泊车转向辅助系统」; 转向、加减速等功能全部自动化的「全自动泊车系统」; 在人的监督下,配合智能钥匙或智能设备使用的「远程智能泊车辅助系统」; 全程
阅读全文
摘要:Darknet_Yolov3模型搭建 YOLO(You only look once)是目前流行的目标检测模型之一,目前最新已经发展到V3版本了,在业界的应用也很广泛。YOLO的特点就是“快”,但由于YOLO对每个网格只预测一个物体,就容易造成漏检,对物体的尺度相对比较敏感,对于尺度变化较大的物体泛
阅读全文
摘要:深度学习调参技巧 训练技巧对深度学习来说是非常重要的,作为一门实验性质很强的科学,同样的网络结构使用不同的训练方法训练,结果可能会有很大的差异。 1.参数初始化 下面几种方式,随便选一个,结果基本都差不多。但是一定要做。否则可能会减慢收敛速度,影响收敛结果,甚至造成Nan等一系列问题。 下面的n_i
阅读全文
摘要:芯片内亿万的晶体管制程工艺 一.原理 晶体管并非是安装上去的,芯片制造其实分为沙子-晶圆,晶圆-芯片这样的过程,而在芯片制造之前,IC涉及要负责设计好芯片,然后交给晶圆代工厂。 芯片设计分为前端设计和后端设计,前端设计(也称逻辑设计)和后端设计(也称物理设计)并没有统一严格的界限,涉及到与工艺有关的
阅读全文
摘要:H.265视频编码与技术全析(下) 四.帧内预测模式 共35个(h264有9个),包括Planar,DC,33个方向模式: 除了Intra_Angular预测外,HEVC还和H.264/MPEG-4 AVC一样,支持Intra_Planar, Intra_DC预测模式; . Intra_DC 使用参
阅读全文
摘要:H.265视频编码与技术全析(上) 一. 概述 作为新一代视频编解码格式,H.265得到越来越广泛的应用。不久之前,苹果公司在翘首期盼中发布了iPhone6,该款手机较之以往的iPhone,不仅仅只是简单地增大了屏幕,其采用了H.265视频编码解码技术,可达到在有限带宽下传输更高质量的网络视频。虽然
阅读全文
摘要:全卷积目标检测:FCOS FCOS: Fully Convolutional One-Stage Object Detection 原文链接:https://arxiv.org/abs/1904.01355 代码链接:https://github.com/tianzhi0549/FCOS/ 摘要 本
阅读全文
摘要:大尺寸卫星图像目标检测:yoloT 1. 前言 YOLT论文全称「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」,是专为卫星图像目标检测而设计的一个检测器,是在YOLOV2的基础上进行改进的。
阅读全文