Bai, IEEE 2019
Mask TextSpotter 结构
- a feature pyramid network (FPN) as backbone.
- a region proposal network (RPN) for generating text proposals.
- a Fast R-CNN for bounding boxes regression.
- a mask branch for text instance segmentation, character segmentation, and text sequence recognition.
数据流动
训练阶段, 由 RPN 产生文本建议(text proposals), 然后文本建议的 RoI 特征喂给 Fast R-CNN, 并且 mask branch 生成精准的文本候选框(candidate boxes), 文本实例分割图(text instance segmentation maps), 字符分割图(character segmentation maps), 和文本序列(text sequence)
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步