gxh973121

博客园 首页 新随笔 联系 订阅 管理
  125 随笔 :: 93 文章 :: 81 评论 :: 15万 阅读

12 2013 档案

摘要:本文是对tesseract-ocr 使用的进一步技术升级说明,使用默认的识别库识别率比较低怎么办?不用着急,tesseract-ocr本身的工具中提供了使用你提供的素材进行人工修正以提高识别率的方法。下面我们就来看一下。参考:http://my.oschina.net/lixinspace/blog/601241 下载并安装3.02版本的tesseract2 如果你的训练素材是很多张非tiff格式的图片,首先要做的事情就是将这么图片合并(个人觉得素材越多,基本每个字母和数字都覆盖了训练出来的识别率比较好)http://sourceforge.net/projects/vietocr/files 阅读全文
posted @ 2013-12-16 10:00 gxh973121 阅读(2270) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示