随笔分类 - OCR

RNN中的注意力机制

摘要：RNN序列编解码器红色输入，蓝色输出绿色编、解码器 Sequence to Sequence模型编码器Encoder把所有的输入序列都编码成一个统一的语义向量Context，然后再由解码器Decoder解码。在解码器Decoder解码的过程中，不断地将前一个时刻 [公式] 的输出作为后一阅读全文

posted @ 2020-06-16 16:45 Parallax 阅读(771) 评论(0) 推荐(0) 编辑

OCR经典pipeline的发展

摘要：Yolo+CRNN >CTPN+CRNN >SegLink+CRNN >East+CRNN >ABCnet(Bezier曲线文本检测+CRNN变体) https://www.leiphone.com/news/202003/CwL9pKfavCd1v8uM.html https://blog.csd 阅读全文

posted @ 2020-06-01 09:48 Parallax 阅读(593) 评论(0) 推荐(0) 编辑

传统OCR的字符切割与识别

摘要：英文字母与阿拉伯数字：连通性好，切割准确汉字：对于左右结构的字切割效果不好，也是因此现在OCR没有到100%识别率的原因之一。当然可以考虑汉字是等宽度的，对于纯中文文本有效。但是当中英文混合的时候效果也不行传统的方法是先识别，然后进行后处理。传统的文本识别过程：考虑倾斜及噪声 1.行检测（水阅读全文

posted @ 2020-05-11 11:05 Parallax 阅读(862) 评论(0) 推荐(0) 编辑

OCR学习

该文被密码保护。

posted @ 2020-05-08 15:58 Parallax 阅读(0) 评论(0) 推荐(0) 编辑

深度学习处理文本数据

摘要：与处理图像一样，也是首先要文本向量化，模型只能作用于文本tensor。分词方法： 1文本分割为单词（分解得到的单元称为标记：token）————分词过程 2文本分割为字符（分解得到的单元称为标记：token）————分词过程 3利用词袋法(bag of words ) 提取单词或字符的n-gra 阅读全文

posted @ 2020-04-26 18:52 Parallax 阅读(435) 评论(0) 推荐(0) 编辑

公告

昵称： Parallax
园龄： 6年6个月
粉丝： 9
关注： 15

+加关注

2025年3月

日

一

二

三

四

五

六

Parallax

初极狭，才通人；复行数十步，豁然开朗。

随笔分类 - OCR

公告

搜索

积分与排名

随笔分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论