机器自动识别验证码的原理是怎么样的?

知乎上的问题,几个回答都非常棒,我简单的总结下:https://www.zhihu.com/question/22479139

1、第一个答案作者写了个大致过程,比较简单。

分为训练样本、建立模型、识别三个过程。

     训练样本:对图像进行预处理,比如分割啊,灰度啊,去噪啊;使用PCA啊,LDA啊之类的对其特征进行

简化处理;

     建立模型:作者给了KNN和SVM,竟然没提CNN。

     识别:实际上就是分类了。

2、第二位答主自己做过。在预处理中,遍历所有像素二值化处理,然后进行切割,最后循环匹配已有的

同字体数据。答主没有说他用的是什么模型,很多想法不知道咋实现的,好想看看源码啊。

3、第三位答主用的是CNN。看上去效果不错,看得出来,数据的来源,预处理很重要。

 

另附一篇博文:

如何识别高级的验证码

     

posted @ 2016-10-24 16:36  牧马人夏峥  阅读(550)  评论(0编辑  收藏  举报