Conmajia

Stop stealing sheep!

导航

< 20253 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

🚗 图像识别试验 - 字符验证码车牌号身份证号待续

© Conmajia 2012

代码在此

这篇文章没有写完后面的资料我也不知道放哪儿去了——Conmajia2014

前言

光学字符识别OCR是非常有用的技术在验证码识别车牌号识别文字识别方面基于字符的识别技术算是比较容易上手的了相比图文识别

闲来看到有朋友研究验证码识别一时手痒野比自己动手来做做验证码识别当然肯定只是简单的验证码

名为验证码实际上并不限于还可以识别车牌号身份证号门牌号等各种乱七八糟的内容

识别的流程很明确

1预处理图像

2y轴的投影

3分析直方图分区

4根据分区拆分图像为多个字符很关键拆得越好后续识别率越高

5丢弃空白或无效字符

6自动旋转字符如果有倾斜识别字符

如果样本中个图像有粘连则可能造成分区不准确这种情况下需要进行旋转但是怎样自动旋转是个难题

目前已可拆分出字符下一步准备研究如何识别如果单个字符比较规范可以利用现成的OCR控件

例子

这里有一些例子

普通的验证码毫无难度

带干扰的验证码

较高强度干扰目前使用的分区算法不能解决需要更好的算法比如动态阈值

CSDN的验证码毫无压力

身份证号码

车牌号

补充个QQ验证码用单一阈值方法识别很困难需要结合字符宽度进行判断

这是单一阈值分区的结果没有限制宽度可以看到效果很差

继续研究如何优化分区算法如何识别单个文字可以考虑多重识别+样本训练

 

附上太平洋网站验证码

有些粘连但是可以通过固定字符宽度解决宽度基本一致

参考这张图获得整个宽度然后除以字符数得到每个宽度分别提取

改进的去污算法

 

污损车牌号拆分字符

 

参考资料

二值化我用的Otsu算法参考文献"A threshold selection method from gray-level histograms", IEEE Trans. Systems, Man and Cybernetics 9(1), pp. 62–66, 1979


关于验证码这篇论文很不错建议参考"Text-based CAPTCHA Strengths and Weaknesses", ACM Computer and Communication security 2011 (CSS'2011)

 

未完待续

posted on2012-06-10   Conmajia  阅读(26082)  评论(0编辑  收藏  举报

编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示