爬虫验证码识别免费开源版(5行代码解决)
背景
爬取数据的过程中难免遇到登录的问题,为了绕过登录,保存cookie是常见的的解决方法.在遇到有验证码的问题时,无疑增加了获取cookie的难度.该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,训练模型的过程,话不多说,直接进入主题.
环境要求
目前已经支持python3.8以下的了,python3.8以上毫无问题。
调用方法
pip install ddddocr
如何使用
1 2 3 4 5 6 7 8 9 10 11 | import ddddocr ocr = ddddocr.DdddOcr() with open ( 'test.png' , 'rb' ) as f: img_bytes = f.read() res = ocr.classification(img_bytes) print (res) |
参数说明
DdddOcr 接受两个参数:
参数名 |
默认值 |
说明 |
use_gpu |
False |
Bool 是否使用gpu进行推理,如果该值为False则device_id不生效 |
device_id |
0 |
int cuda设备号,目前仅支持单张显卡 |
classification参数:
参数名 |
默认值 |
说明 |
img |
0 |
bytes 图片的bytes格式 |
我试了试很不错,而且是cpu的情况下,几毫秒返回结果。
我的验证码如下:
想要学习Python基础知识的,扫描右上角二维码关注作者的公众号,回复"专辑"俩字.进行知识的获取
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 理解Rust引用及其生命周期标识(下)
· 从二进制到误差:逐行拆解C语言浮点运算中的4008175468544之谜
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 2025成都.NET开发者Connect圆满结束
· Ollama本地部署大模型总结
· langchain0.3教程:从0到1打造一个智能聊天机器人
· 在 VS Code 中,一键安装 MCP Server!
· 用一种新的分类方法梳理设计模式的脉络