随笔分类 - ocr

在VS2010下编译和使用tesseract_ocr识别验证码

摘要：对于自动识别验证码，使用trsseract是个不错的选择，有兴趣的的朋友可以试试。编译tesseract官网提供了vs2008的编译说明和工程，但在vs2010下的编译时基本相同的，因此我使用的方法就是把vs2008工程转换为vs2010工程，同时把编译过程中遇到的问题以及解决方法和大家分享一下，希... 阅读全文

posted @ 2014-07-25 14:50 gxh973121 阅读(1271) 评论(0) 推荐(0) 编辑

tesseract-ocr 提高验证码识别率手段之---识别码库训练方法

摘要：本文是对tesseract-ocr 使用的进一步技术升级说明，使用默认的识别库识别率比较低怎么办？不用着急，tesseract-ocr本身的工具中提供了使用你提供的素材进行人工修正以提高识别率的方法。下面我们就来看一下。参考：http://my.oschina.net/lixinspace/blog/601241 下载并安装3.02版本的tesseract2 如果你的训练素材是很多张非tiff格式的图片，首先要做的事情就是将这么图片合并（个人觉得素材越多，基本每个字母和数字都覆盖了训练出来的识别率比较好）http://sourceforge.net/projects/vietocr/files 阅读全文

posted @ 2013-12-16 10:00 gxh973121 阅读(2270) 评论(0) 推荐(0) 编辑

车牌识别及验证码识别的一般思路

摘要：source:http://www.cnblogs.com/xiaotie/archive/2009/01/15/1376677.html本文源自我之前花了2天时间做的一个简单的车牌识别系统。那个项目，时间太紧，样本也有限，达不到对方要求的95%识别率（主要对于车牌来说，D,0，O，I，1等等太相似了。然后，汉字的识别难度也不小），因此未被对方接受。在此放出，同时描述一下思路及算法。全文分两部分，... 阅读全文

posted @ 2009-02-21 17:30 gxh973121 阅读(711) 评论(1) 推荐(1) 编辑

gxh973121

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

文章档案

blog website

crack

personal blog(cn)

personal blog(en)

personal blog(no technic )

sourceproject

website

阅读排行榜

推荐排行榜

随笔分类 - ocr