最近做自动化遇到验证码的问题,之前识别字母和数字验证码都是使用tesseract.js,识别率都不错,中文也可以识别不过识别率不高。
我自己平常使用识别验证码的方式主要有三种,
- 一种是上面说的tesseract.js,
- 另一种骚操作就是使用通用文字识别工具,即OCR,很多云计算公司都提供了OCR识别。如果遇到中文验证码,使用OCR还是比较方便的。
- 还有一种就是用node去调用Python的验证码识别程序
不过这次遇到的验证码字母都进行了扭曲,且字母之间有重叠,使用tesseract.js识别率比较低,自己又不想进行识别训练。。。

上网找了一下验证码识别平台,试了斐斐打码和超级鹰,识别率都很高。超级鹰提供了nodejs的demo,不过不能正常运行,只能自食其力了。
var request = require('request'),
fs = require('fs');
function recongizeCode(pathName){
var file_base64 = fs.readFileSync(pathName,'base64');
const formData = {
'user': 'usercount',
'pass': 'password',
'softid':'id',
'codetype': '3004',
'file_base64': file_base64
};
return new Promise(function(resolve,reject){
request({
url: 'http://upload.chaojiying.net/Upload/Processing.php',
method: "POST",
headers: {
"content-type": "application/x-www-form-urlencoded",
},
body: JSON.stringify(formData)
}, function(error, response, body) {
if (!error && response.statusCode == 200) {
resolve(JSON.parse(body)['pic_str'])
console.log(body)
}
});
})
}
module.exports = recongizeCode
recongizeCode('./1.jpg')

【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?