会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
physoft
3D Visualization & Image Identification
博客园
首页
新随笔
联系
订阅
管理
2012年2月6日
OCR - 版式分析
摘要: OCR图像一般有两种:有格式的近距离图像或者扫描件,如身份证,名片,人民币、美元;无格式的图像,如使用Tesseract OCR 提取复杂图像中的文字。最近 有格式的近距离图像识别项目比较多,因此积累了一套版式分析(Layout Analysis)的算法,快速、可抗强干扰(光线、阴影)和噪音(污染、遮挡、背景)。特别适合证件,钱币等格式比较固定,内容较少但字比较分散的图像OCR。
阅读全文
posted @ 2012-02-06 14:40 physoft
阅读(2068)
评论(3)
推荐(1)
编辑
公告