随笔分类 -  OCR

文本检测,文字识别类算法学习
摘要:目前常用的文字识别网络主要有两种,一种是通过CRNN+CTC的方法(参见CRNN),一种是seq2seq+attention的方法。有说CTC方法优于seq2seq+attention的,但随着attention机制的发展(self-attention, transformer),也许seq2seq 阅读全文
posted @ 2021-01-06 15:02 silence_cho 阅读(3708) 评论(0) 推荐(2) 编辑
摘要:OCR(Optical Character Recognition)任务主要是识别出图片中的文字,目前深度学习的方法采用两步来解决这个问题,一是文字检测网络定位文字位置,二是文字识别网络识别出文字。 关于OCR的综述参考:http://xiaofengshi.com/2019/01/05/%E6%B 阅读全文
posted @ 2021-01-06 14:59 silence_cho 阅读(2739) 评论(0) 推荐(1) 编辑
摘要:本文大量摘抄和节选于下列文章: https://zhuanlan.zhihu.com/p/108547594 https://lipengwei.github.io/2018/08/10/CTC原理/ https://blog.csdn.net/JackyTintin/article/details 阅读全文
posted @ 2021-01-06 14:57 silence_cho 阅读(1064) 评论(0) 推荐(0) 编辑
摘要:现有的文本检测方法主要有两大类,一种是基于回归框的检测方法(基于物体检测的方法),如CTPN,EAST,这类方法很难检测任意形状的文本(曲线文本), 一种是基于像素的分割检测器(基于实例分割的方法),这类方法很难将彼此非常接近的文本实例分开。Psenet文本检测方法是基于分割的方法,在2019年的论 阅读全文
posted @ 2020-12-26 11:56 silence_cho 阅读(1576) 评论(0) 推荐(1) 编辑
摘要:EAST是旷视科技在2017年论文East: An Efficient and Accurate Scene Text Detector中提出,能检测任意角度的文字,速度和准确度都很有优势。 East算是一篇很有特色的文章,还是从网络设计,GroundTruth生成,loss函数和Locality- 阅读全文
posted @ 2020-12-26 11:54 silence_cho 阅读(1718) 评论(0) 推荐(0) 编辑
摘要:CTPN文字检测网络,是在2016年的论文Detecting Text in Natural Image with Connectionist Text Proposal Network中提出,其在Fast-rcnn的基础上进行改进,提出了一种适合检测文字的神经网络,算是一篇开创性的论文,影响了后面 阅读全文
posted @ 2020-12-26 10:01 silence_cho 阅读(1934) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示