silence_cho

2021年1月6日

摘要：目前常用的文字识别网络主要有两种，一种是通过CRNN+CTC的方法(参见CRNN)，一种是seq2seq+attention的方法。有说CTC方法优于seq2seq+attention的，但随着attention机制的发展(self-attention, transformer)，也许seq2seq 阅读全文

posted @ 2021-01-06 15:02 silence_cho 阅读(3630) 评论(0) 推荐(2) 编辑

文字识别网络学习—CRNN+CTC

摘要： OCR(Optical Character Recognition)任务主要是识别出图片中的文字，目前深度学习的方法采用两步来解决这个问题，一是文字检测网络定位文字位置，二是文字识别网络识别出文字。关于OCR的综述参考：http://xiaofengshi.com/2019/01/05/%E6%B 阅读全文

posted @ 2021-01-06 14:59 silence_cho 阅读(2624) 评论(0) 推荐(1) 编辑

ctc原理理解(转载)

摘要：本文大量摘抄和节选于下列文章： https://zhuanlan.zhihu.com/p/108547594 https://lipengwei.github.io/2018/08/10/CTC原理/ https://blog.csdn.net/JackyTintin/article/details 阅读全文

posted @ 2021-01-06 14:57 silence_cho 阅读(1021) 评论(0) 推荐(0) 编辑

2021年1月5日

单目标跟踪算法SiamRPN

摘要：目标跟踪算法包括单目标跟踪和多目标跟踪，单目标跟踪在每张图片中只跟踪一个目标。目前单目标跟踪的主要方法分为两大类，基于相关滤波(correlation filter)的跟踪算法, 如CSK， KCF, DCF, SRDCF等；基于深度学习的跟踪算法，如SiamFC, SiamRPN, SiamRPN 阅读全文

posted @ 2021-01-05 15:21 silence_cho 阅读(13753) 评论(3) 推荐(2) 编辑

2020年12月26日

文本检测网络Psenet学习(三)

摘要：现有的文本检测方法主要有两大类，一种是基于回归框的检测方法(基于物体检测的方法)，如CTPN，EAST，这类方法很难检测任意形状的文本(曲线文本)，一种是基于像素的分割检测器(基于实例分割的方法)，这类方法很难将彼此非常接近的文本实例分开。Psenet文本检测方法是基于分割的方法，在2019年的论阅读全文

posted @ 2020-12-26 11:56 silence_cho 阅读(1523) 评论(0) 推荐(1) 编辑

文本检测网络EAST学习(二)

摘要： EAST是旷视科技在2017年论文East: An Efficient and Accurate Scene Text Detector中提出，能检测任意角度的文字，速度和准确度都很有优势。 East算是一篇很有特色的文章，还是从网络设计，GroundTruth生成，loss函数和Locality- 阅读全文

posted @ 2020-12-26 11:54 silence_cho 阅读(1673) 评论(0) 推荐(0) 编辑

文本检测网络CTPN学习(一)

摘要： CTPN文字检测网络，是在2016年的论文Detecting Text in Natural Image with Connectionist Text Proposal Network中提出，其在Fast-rcnn的基础上进行改进，提出了一种适合检测文字的神经网络，算是一篇开创性的论文，影响了后面阅读全文

posted @ 2020-12-26 10:01 silence_cho 阅读(1864) 评论(0) 推荐(0) 编辑

2020年11月15日

目标检测网络SSD详解(三)

摘要： SSD目标检测网络使用SSD检测网络一段时间了，研究过代码，也踩过坑，算是有能力来总结下SSD目标检测网络了。 1. SSD300_Vgg16 最基础的SSD网络是以Vgg16作为backbone, 输入图片尺寸为300x300，这里以其为示例，详细剖析下SSD检测网络。 SSD(Single S 阅读全文

posted @ 2020-11-15 17:31 silence_cho 阅读(6014) 评论(0) 推荐(1) 编辑

目标检测网络yolo3详解(二)

摘要： yolo v3目标检测网络 yolo3的运行速度快，检测效果也不差，算是使用最广泛的目标检测网络了。对于yolo3的理解，也主要在于三点，一是网络结构和模型流程的理解；二是对于正负样本分配的理解(anchor和gt_box之间的匹配)；三是对于loss函数的理解 1.1 yolo v3 网络结构 y 阅读全文

posted @ 2020-11-15 17:19 silence_cho 阅读(2964) 评论(0) 推荐(1) 编辑

目标检测网络CenterNet详解(四)

摘要： CenterNet是在2019年论文Objects as points中提出，相比yolo，ssd，faster_rcnn依靠大量anchor的检测网络，CenterNet是一种anchor-free的目标检测网络，在速度和精度上都比较有优势，值得学习下。对于CenterNet的理解主要在于四方面阅读全文

posted @ 2020-11-15 17:13 silence_cho 阅读(35615) 评论(4) 推荐(4) 编辑

公告