金天牛

导航

使用python库解决登录的验证码识别-图片验证码

前言:

在UI自动化测试和爬虫测试中,验证码是个比较头疼的问题,包括:图片验证码,滑块验证码,等一些常见的验证码场景。

识别验证码的python 库有很多,用起来也并不简单,这里推荐一个简单实用的识别验证码的库 ddddocr (带带弟弟ocr)库。

今天先用一个图片验证码示例来演示下:

准备:

1.安装库ddddocr

2.安装库pillow

3.以一个带验证码登录的网站为示例:https://xqctk.jtys.sz.gov.cn/

开始编码:

1代码如下:

 1 import time
 2 from ddddocr import DdddOcr
 3 from selenium import webdriver
 4 from selenium.webdriver.common.by import By
 5 from PIL import Image  # 需安装 pillow
 6 
 7 path = 'https://xqctk.jtys.sz.gov.cn/'
 8 
 9 
10 def get_picture_code(locator):
11     pic_save_path = 'D://html.png'
12     cron_path = 'D://code.png'
13     browser.save_screenshot(pic_save_path)  # 保存为图片
14     location = browser.find_element(By.XPATH, locator)  # 获取需要识别的元素对象
15     size = location.size  # 获取需要识别的元素尺寸
16     position = (int(location.location['x']), int(location.location['y']), int(location.location['x'] + size['width']), int(location.location['y'] + size['height']))
17     Image.open(pic_save_path).crop(box=position).save(cron_path)  # crop进行裁剪
18     with open(cron_path, 'rb') as f:
19         img_bytes = f.read()
20         res = DdddOcr().classification(img_bytes)
21     return res
22 
23 
24 browser = webdriver.Chrome()  # 打开浏览器
25 browser.maximize_window()  # 浏览器最大化
26 browser.get(path)  # 打开网页
27 time.sleep(5)
28 pic_code = get_picture_code("//td[@id='incrementGetValidCodeImg']//img")
29 browser.find_element(By.XPATH, "//input[@id='incrementValidCode']").send_keys(pic_code)
30 time.sleep(5)
31 browser.quit()

运行结果:

 

posted on 2023-04-11 11:07  金天牛  阅读(489)  评论(0编辑  收藏  举报