验证码识别原理浅谈-总谈

声明:这里只是本人在做项目中的一些自己的个人意见,仅供参考;由于本人时间方面原因,有些语句会出现不通顺的情况,请大家谅解,我尽量的用比较通用的方式把我的思路给表达出来

验证码的识别过程就好比人大脑的一个识别过程,譬如说平常我们看到一张图片,首先我们的眼睛接收,并将这张图片的信息输送给大脑,然后我们的大脑接收到这个图片信息以后,对这个图片信息作出处理,将图片中的有效信息给抠出来,譬如说

这个QQ的验证码图片,我们肯定是将其中的深蓝色的信息作为有效的信息,接下来我们再将这个信息跟我们大脑内部所储存的一些文字的信息(规则、值)进行对比,然后确定这个验证码的结果是ZQCY;,想腾讯这么变态的验证码,我们人脑有的时候还会处理失败,因此对于自动程序来讲,如果想将识别率做的很高也不现实,一般情况下识别率可以达到80%以上

我们平常在做验证码识别的时候,基本也就根据人脑识别的这个思路,基本也就是一个“做字库(人脑学习)”-“获取图片有效信息(分离图片有效信息)”-“字库对比识别(对图片进行分析,确定代表值)”

其实在做字库(学习)的时候也就是一个识别的过程,我们先对图片进行识别,看是否能够识别,如果不识别,我们就会咨询其他人,得出这个形状所代表的具体值,然后再将其存入字库(大脑)

之后,我会根据我的程序具体的将我上边所将的这个步骤进行一下详细的解说,另外其中的算法我也会把核心的给附带上

posted on 2009-01-15 15:49  cntlis  阅读(5110)  评论(2编辑  收藏  举报

导航