机器自动识别验证码的原理是怎么样的?
知乎上的问题,几个回答都非常棒,我简单的总结下:https://www.zhihu.com/question/22479139
1、第一个答案作者写了个大致过程,比较简单。
分为训练样本、建立模型、识别三个过程。
训练样本:对图像进行预处理,比如分割啊,灰度啊,去噪啊;使用PCA啊,LDA啊之类的对其特征进行
简化处理;
建立模型:作者给了KNN和SVM,竟然没提CNN。
识别:实际上就是分类了。
2、第二位答主自己做过。在预处理中,遍历所有像素二值化处理,然后进行切割,最后循环匹配已有的
同字体数据。答主没有说他用的是什么模型,很多想法不知道咋实现的,好想看看源码啊。
3、第三位答主用的是CNN。看上去效果不错,看得出来,数据的来源,预处理很重要。
另附一篇博文: