登录页面图片验证码获取(OCR)
百度OCR网站地址:https://ai.baidu.com,新建图文识别产品,拿到对应的appid、appkey、secretkey
ocr提供了模板,可以直接复制
安装三方库
pip install baidu-aip
pip install pillow
from selenium import webdriver import time from PIL import Image from aip import AipOcr from os import path class login(): def get_code(self, browser): # (3)获取图片验证码坐标 code_ele = browser.find_element_by_xpath("//img[@id='captcha']") print("验证码的坐标为:", code_ele.location)#控制台查看{'x': 1086, 'y': 368} print("验证码的大小为:", code_ele.size)# 图片大小{'height': 40, 'width': 110} # (4)图片4个点的坐标位置 left = code_ele.location['x']#x点的坐标 top = code_ele.location['y']#y点的坐标 right = code_ele.size['width']+left#上面右边点的坐标 down = code_ele.size['height']+top#下面右边点的坐标 image = Image.open('D:/pic.png') # (4)将图片验证码截取 code_image = image.crop((left, top, right, down)) code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件 def baiduOCR(self, picfile, outfile): # picfile:图片文件名 outfile:输出文件 filename = path.basename(picfile) # 图片名称 # 百度提供 """ 你的 APPID AK SK """ APP_ID = '23054650' # 这是你产品服务的appid API_KEY = 'kEKxwQx9TEOWCKflaG4CXR2C' # 这是你产品服务的appkey SECRET_KEY = 'AxzVIi56TIn8zliGDekGc735029fUTlP' # 这是你产品服务的secretkey client = AipOcr(APP_ID, API_KEY, SECRET_KEY) i = open(picfile, 'rb') img = i.read() print("正在识别图片:\t" + filename) """ 调用通用文字识别(高精度版) """ message = client.basicAccurate(img) print("识别成功!") i.close() # with open(outfile, 'a+') as fo: # 这边是写进.txt文件 # fo.writelines("*" * 60 + '\n') # 搞点花里胡哨的做区分 # fo.writelines("识别图片:\t" + filename + "\n" * 2) # fo.writelines("文本内容:\n") # # 输出文本内容 # for text in message.get('words_result'): # 识别的内容 # fo.writelines(text.get('words') + '\n') # fo.writelines('\n' * 2) # print("文本导出成功!") print() # 将每行文字拼接成一个整体 string_text = "" for text in message.get('words_result'): string_text += text.get('words') print('string_text:', string_text) return string_text if __name__ == '__main__': l = login() base_url = 'http://xxxxxxxxx' browser = webdriver.Chrome() browser.maximize_window() # 最大化视图 browser.implicitly_wait(10) browser.get(base_url) time.sleep(5) # (1)登录页面截图 browser.save_screenshot("D:/pic.png") # 可以修改保存地址 # (2)基操 browser.find_element_by_name("username").send_keys("admin") browser.find_element_by_name("password").send_keys("123456") time.sleep(2) l.get_code(browser) outfile = 'D:/export1.txt' # 保存的文件 string_text = l.baiduOCR('D:/pic1.png', outfile) # print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile) browser.find_element_by_name("captcha").send_keys(string_text) browser.find_element_by_xpath('//*[@id="submit"]').click()