随笔分类 - OCR
摘要:RNN序列编解码器 红色 输入,蓝色 输出 绿色 编、解码器 Sequence to Sequence模型 编码器Encoder把所有的输入序列都编码成一个统一的语义向量Context,然后再由解码器Decoder解码。在解码器Decoder解码的过程中,不断地将前一个时刻 [公式] 的输出作为后一
阅读全文
摘要:Yolo+CRNN >CTPN+CRNN >SegLink+CRNN >East+CRNN >ABCnet(Bezier曲线文本检测+CRNN变体) https://www.leiphone.com/news/202003/CwL9pKfavCd1v8uM.html https://blog.csd
阅读全文
摘要:英文字母与阿拉伯数字:连通性好,切割准确 汉字:对于左右结构的字切割效果不好,也是因此现在OCR没有到100%识别率的原因之一。 当然可以考虑汉字是等宽度的,对于纯中文文本有效。但是当中英文混合的时候效果也不行 传统的方法是先识别,然后进行后处理。 传统的文本识别过程:考虑倾斜及噪声 1.行检测(水
阅读全文
摘要:与处理图像一样,也是首先要文本向量化,模型只能作用于文本tensor。 分词方法: 1文本分割为单词(分解得到的单元称为标记:token)————分词过程 2文本分割为字符(分解得到的单元称为标记:token)————分词过程 3利用 词袋法(bag of words ) 提取单词或字符的n-gra
阅读全文