使用Tesseract OCR 提取美元序列号

最近使用Tesseract OCR 识别了美元序列号。原本使用自己开发的OCR库识别（下称B库）. B库在字符集很小的时候，比如A-Z, 0-9, 识别室外字符性能远优越于Tesseract OCR. 因为室外字符光照，阴影，噪音非常严重，二值化后往往字符有大量较大空洞和光照噪音，使用形态学运算补洞显然行不通，所以Tesseract OCR会有大量错识别和误识别。B库在识别室外运动员号码项目中，以人为单位的识别正确率>90%, 以字符为单位的识别>97%. 但是美元序列号识别项目中，序列号的分辨率不高，但是字符非常规整，针对字符特征做旋转纠正和特殊较复杂的二值化，可以得到非常好的连通字符。使用Tesseract OCR识别率达到了100%!

原始样图：

旋转和二值化后的图片：可见二值化的效果非常的好。美元的序列号附近区域没有定位特征，而且不同币值的序列号位置，大小，背景等等都不是很确定的，所以不能使用相对百分里来定位序列号。而需要使用比较特殊，快速的字符定位。然后在字符区做针对字符的特殊二值化，才能很好的除去背景。

比较旧的币：

旋转和二值化的结果：

posted @ 2011-09-19 13:16 physoft 阅读(2111) 评论(0) 编辑收藏举报

刷新页面返回顶部

使用Tesseract OCR 提取美元序列号

公告