摘要:
字符识别OCR原理及应用实现 文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 工业场景的图像文字识别 阅读全文
摘要:
4D雷达成像技术 当我们谈及3D捕捉时,总是先想到光学传感器。当我们讨论在第四维度(时间)讨论视觉数据时,倾向于考虑场景数据调度。这些是我们多年来关注激光雷达(LiDAR)和摄影测量,以及用户针对缓慢移动的大型项目,在时间尺度上将这些技术应用于静态物体所造成的偏见。 对自动驾驶汽车不可思议的需求推动 阅读全文
摘要:
大型图像数据聚类匹配:ICCV2019论文解析 Jointly Aligning Millions of Images with Deep Penalised Reconstruction Congealing 论文链接: http://openaccess.thecvf.com/content_I 阅读全文
摘要:
深度学习数据特征提取:ICCV2019论文解析 Goal-Driven Sequential Data Abstraction 论文链接: http://openaccess.thecvf.com/content_ICCV_2019/papers/Muhammad_Goal-Driven_Seque 阅读全文
摘要:
深度学习常见问题解析 计算机视觉与自动驾驶 今天 一、为什么深层神经网络难以训练? 1、梯度消失。梯度消失是指通过隐藏层从后向前看,梯度会变得越来越小,说明前面层的学习会显著慢于后面层的学习,所以学习会卡主,除非梯度变大。 梯度消失的原因:学习率的大小,网络参数的初始化,激活函数的边缘效应等。在深层 阅读全文