摘要: 目前常用的文字识别网络主要有两种,一种是通过CRNN+CTC的方法(参见CRNN),一种是seq2seq+attention的方法。有说CTC方法优于seq2seq+attention的,但随着attention机制的发展(self-attention, transformer),也许seq2seq 阅读全文
posted @ 2021-01-06 15:02 silence_cho 阅读(3630) 评论(0) 推荐(2) 编辑
摘要: OCR(Optical Character Recognition)任务主要是识别出图片中的文字,目前深度学习的方法采用两步来解决这个问题,一是文字检测网络定位文字位置,二是文字识别网络识别出文字。 关于OCR的综述参考:http://xiaofengshi.com/2019/01/05/%E6%B 阅读全文
posted @ 2021-01-06 14:59 silence_cho 阅读(2632) 评论(0) 推荐(1) 编辑
摘要: 本文大量摘抄和节选于下列文章: https://zhuanlan.zhihu.com/p/108547594 https://lipengwei.github.io/2018/08/10/CTC原理/ https://blog.csdn.net/JackyTintin/article/details 阅读全文
posted @ 2021-01-06 14:57 silence_cho 阅读(1026) 评论(0) 推荐(0) 编辑