www.cnblogs.com/ruiyqinrui

开源、架构、Linux C/C++/python AI BI 运维开发自动化运维。 春风桃李花 秋雨梧桐叶。“力尽不知热 但惜夏日长”。夏不惜,秋不获。@ruiY--秦瑞

python爬虫,C编程,嵌入式开发.hadoop大数据,桉树,onenebula云计算架构.linux运维及驱动开发.

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

主要记录一下:图片验证码
1.获取登录界面的图片
2.获取验证码位置
3.在登录页面截取验证码保存
4.调用百度api识别(目前准确率较高的识别图片api)
本次登录的系统页面,可以看到图片验证码的位置登录页面

from selenium import webdriver
import time
from PIL import Image

base_url = '***********'
browser = webdriver.Chrome()
browser.maximize_window()
browser.implicitly_wait(10)
browser.get(base_url)

# (1)登录页面截图
browser.save_screenshot("D:/pic.png")#可以修改保存地址
# (2)基操
browser.find_element_by_name("username").send_keys("gxx")
browser.find_element_by_name("password").send_keys("123456")
time.sleep(2)
# (3)获取图片验证码坐标
code_ele = browser.find_element_by_xpath("//*[@id='app']/div/div[1]/form/div[3]/div/div/div[2]/div/img")
print("验证码的坐标为:", code_ele.location)#控制台查看{'x': 1086, 'y': 368}
print("验证码的大小为:", code_ele.size)# 图片大小{'height': 40, 'width': 110}
# (4)图片4个点的坐标位置
left = code_ele.location['x']#x点的坐标
top = code_ele.location['y']#y点的坐标
right = code_ele.size['width']+left#上面右边点的坐标
down = code_ele.size['height']+top#下面右边点的坐标
image = Image.open('D:/pic.png')
# (4)将图片验证码截取
code_image = image.crop((left, top, right, height))
code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件

上面我们已经把图片保存到本地
这就是我们截取的验证码
在这里插入图片描述
接下来要调用 百度ocr识别
链接: https://ai.baidu.com/docs#/
然后可以选择通用文字识别或者 高精度版本,这个 看个人选择,不过验证码识别还是选择高精度 版本(也不一定识别的出来 大家还是佛吧,测试的时候让开发把验证码去掉嘻嘻)
自己去申请一个百度云账号,然后开通文字识别服务…就酱
更新一下 代码,把一些 不必要的东西去掉。直接 获取内容,不输出到文件,可以控制台打印查看
新建一个py文件


#百度ocr提供了模板,我们直接复制就ok
#下载通用文字识别的python sdk,一定要放在你写的代码的文件夹下面
from aip import AipOcr

def baiduOCR(picfile):#picfile:图片文件名
    #百度提供
    """ 你的 APPID AK SK """
    APP_ID = ''#这是你产品服务的appid
    API_KEY = ''#这是你产品服务的appkey
    SECRET_KEY = ''#这是你产品服务的secretkey
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    i = open(picfile, 'rb')
    img = i.read()
    """ 调用通用文字识别(高精度版) """
    message = client.basicAccurate(img)
    i.close()
 
    # 输出文本内容
        for text in message.get('words_result'):#识别的内容
            print(text.get('words'))

if __name__ == '__main__' :
    baiduOCR('D:/pic1.png')


直接控制台输出:27d2
这样就识别出来 了,这个能识别正确我也是惊讶了
毕竟之前好多次都 识别的不准确
好!这样 验证码就识别出来 惹,然后把识别的内容输进框子里,点击登录就ok

posted on 2019-11-22 17:23  秦瑞It行程实录  阅读(1122)  评论(0编辑  收藏  举报
www.cnblogs.com/ruiyqinrui