随笔分类 -  OCR 论文

摘要:Mask TextSpotter 结构 a feature pyramid network (FPN) as backbone. a region proposal network (RPN) for generating text proposals. a Fast R CNN for bound 阅读全文
posted @ 2019-10-19 09:52 larkii 阅读(120) 评论(0) 推荐(0)
摘要:CRNN 在文字识别上的优点: 对于序列类型的对象, CRNN所具有的优点: CRNN 由 1. 卷积层 2. 循环层(BLSTM) 3. 转录层 (CTC) 构成 信息提取: 给序列贴标签: 循环网络(BLSTM) 给特征序列中的每个特征向量预测一个标签分布(probability) 循环网络有三 阅读全文
posted @ 2019-10-14 20:51 larkii 阅读(515) 评论(0) 推荐(0)
摘要:作者提出了 CTPN(Connectionist Text Proposal Network) 模型, 来直接检测文字序列.(端到端) CTPN 主要做了三个工作使它这么强: 作者的工作: Ren 等人使用 锚回归机制 来使小尺寸滑动窗口能够检测到不同大小的对象 (对象检测). > 作者借鉴了RPN 阅读全文
posted @ 2019-10-12 10:00 larkii 阅读(238) 评论(0) 推荐(0)
摘要:作者的模型整体框架包含两部分,分别为 OCR 部分 (采用人家的模型, 输出文本) 特定文本抽取部分 (作者的工作) 1. 引言 早期图像特定文本抽取主要是通过 OCR 中的版面分析(Layout analysis)来实现。即首先利用 版面分析 的方法得到图像中特定的文本区域,然后对特定文本区域进行 阅读全文
posted @ 2019-10-10 19:25 larkii 阅读(411) 评论(0) 推荐(0)
摘要:Abstract 现在广泛使用的 PSNR 和 SSIM 在解释人类感知上失败了. 但是, Recently, the deep learning community has found that features of the VGG networktrained on ImageNet clas 阅读全文
posted @ 2019-09-27 10:48 larkii 阅读(143) 评论(0) 推荐(0)