gxh973121

博客园 首页 新随笔 联系 订阅 管理
  125 随笔 :: 93 文章 :: 81 评论 :: 15万 阅读

随笔分类 -  ocr

摘要:对于自动识别验证码,使用trsseract是个不错的选择,有兴趣的的朋友可以试试。编译tesseract官网提供了vs2008的编译说明和工程,但在vs2010下的编译时基本相同的,因此我使用的方法就是把vs2008工程转换为vs2010工程,同时把编译过程中遇到的问题以及解决方法和大家分享一下,希... 阅读全文
posted @ 2014-07-25 14:50 gxh973121 阅读(1271) 评论(0) 推荐(0) 编辑

摘要:本文是对tesseract-ocr 使用的进一步技术升级说明,使用默认的识别库识别率比较低怎么办?不用着急,tesseract-ocr本身的工具中提供了使用你提供的素材进行人工修正以提高识别率的方法。下面我们就来看一下。参考:http://my.oschina.net/lixinspace/blog/601241 下载并安装3.02版本的tesseract2 如果你的训练素材是很多张非tiff格式的图片,首先要做的事情就是将这么图片合并(个人觉得素材越多,基本每个字母和数字都覆盖了训练出来的识别率比较好)http://sourceforge.net/projects/vietocr/files 阅读全文
posted @ 2013-12-16 10:00 gxh973121 阅读(2270) 评论(0) 推荐(0) 编辑

摘要:source:http://www.cnblogs.com/xiaotie/archive/2009/01/15/1376677.html本文源自我之前花了2天时间做的一个简单的车牌识别系统。那个项目,时间太紧,样本也有限,达不到对方要求的95%识别率(主要对于车牌来说,D,0,O,I,1等等太相似了。然后,汉字的识别难度也不小),因此未被对方接受。在此放出,同时描述一下思路及算法。全文分两部分,... 阅读全文
posted @ 2009-02-21 17:30 gxh973121 阅读(711) 评论(1) 推荐(1) 编辑

点击右上角即可分享
微信分享提示