上一页 1 2 3 4 5 6 7 ··· 10 下一页
摘要: OCR(Optical Character Recognition)任务主要是识别出图片中的文字,目前深度学习的方法采用两步来解决这个问题,一是文字检测网络定位文字位置,二是文字识别网络识别出文字。 关于OCR的综述参考:http://xiaofengshi.com/2019/01/05/%E6%B 阅读全文
posted @ 2021-01-06 14:59 silence_cho 阅读(2568) 评论(0) 推荐(1) 编辑
摘要: 本文大量摘抄和节选于下列文章: https://zhuanlan.zhihu.com/p/108547594 https://lipengwei.github.io/2018/08/10/CTC原理/ https://blog.csdn.net/JackyTintin/article/details 阅读全文
posted @ 2021-01-06 14:57 silence_cho 阅读(977) 评论(0) 推荐(0) 编辑
摘要: 目标跟踪算法包括单目标跟踪和多目标跟踪,单目标跟踪在每张图片中只跟踪一个目标。目前单目标跟踪的主要方法分为两大类,基于相关滤波(correlation filter)的跟踪算法, 如CSK, KCF, DCF, SRDCF等;基于深度学习的跟踪算法,如SiamFC, SiamRPN, SiamRPN 阅读全文
posted @ 2021-01-05 15:21 silence_cho 阅读(13436) 评论(3) 推荐(2) 编辑
摘要: 现有的文本检测方法主要有两大类,一种是基于回归框的检测方法(基于物体检测的方法),如CTPN,EAST,这类方法很难检测任意形状的文本(曲线文本), 一种是基于像素的分割检测器(基于实例分割的方法),这类方法很难将彼此非常接近的文本实例分开。Psenet文本检测方法是基于分割的方法,在2019年的论 阅读全文
posted @ 2020-12-26 11:56 silence_cho 阅读(1455) 评论(0) 推荐(1) 编辑
摘要: EAST是旷视科技在2017年论文East: An Efficient and Accurate Scene Text Detector中提出,能检测任意角度的文字,速度和准确度都很有优势。 East算是一篇很有特色的文章,还是从网络设计,GroundTruth生成,loss函数和Locality- 阅读全文
posted @ 2020-12-26 11:54 silence_cho 阅读(1607) 评论(0) 推荐(0) 编辑
摘要: CTPN文字检测网络,是在2016年的论文Detecting Text in Natural Image with Connectionist Text Proposal Network中提出,其在Fast-rcnn的基础上进行改进,提出了一种适合检测文字的神经网络,算是一篇开创性的论文,影响了后面 阅读全文
posted @ 2020-12-26 10:01 silence_cho 阅读(1775) 评论(0) 推荐(0) 编辑
摘要: SSD目标检测网络 使用SSD检测网络一段时间了,研究过代码,也踩过坑,算是有能力来总结下SSD目标检测网络了。 1. SSD300_Vgg16 最基础的SSD网络是以Vgg16作为backbone, 输入图片尺寸为300x300,这里以其为示例,详细剖析下SSD检测网络。 SSD(Single S 阅读全文
posted @ 2020-11-15 17:31 silence_cho 阅读(5846) 评论(0) 推荐(1) 编辑
摘要: yolo v3目标检测网络 yolo3的运行速度快,检测效果也不差,算是使用最广泛的目标检测网络了。对于yolo3的理解,也主要在于三点,一是网络结构和模型流程的理解;二是对于正负样本分配的理解(anchor和gt_box之间的匹配);三是对于loss函数的理解 1.1 yolo v3 网络结构 y 阅读全文
posted @ 2020-11-15 17:19 silence_cho 阅读(2878) 评论(0) 推荐(1) 编辑
摘要: CenterNet是在2019年论文Objects as points中提出,相比yolo,ssd,faster_rcnn依靠大量anchor的检测网络,CenterNet是一种anchor-free的目标检测网络,在速度和精度上都比较有优势,值得学习下。 对于CenterNet的理解主要在于四方面 阅读全文
posted @ 2020-11-15 17:13 silence_cho 阅读(34846) 评论(4) 推荐(3) 编辑
摘要: one-stage的检测精度比不上two-stage,一个主要原因是训练过程样本不均衡造成。样本不均衡主要包括两方面,一是正负样本的不均衡;二是难易样本的不均衡。目前解决这类问题主要是两种方案(见综述Imbalance Problems in Object Detection: A Review): 阅读全文
posted @ 2020-11-14 16:20 silence_cho 阅读(5362) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 10 下一页