selenium简单识别验证码

　　selenium简单识别验证码，识别验证码图片，不太精准，原理上是这样：

import subprocess

#验证png图片不报错，可以识别图片为文字，但是不精准，jpg也可以识别，但是会报错，也会生出txt文档
#第一个是安装的Tesseract-OCR的路径，第二个是验证码的图片的路径
p=subprocess.Popen([r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe",r"D:\python爬虫视频\爬虫代码\seleniumText\1.png","last"],stdout=subprocess.PIPE,stderr=subprocess.PIPE)
p.wait()
file=open("last.txt","r")
print(file.read())

posted on 2020-03-11 10:56 共感的艺术阅读(237) 评论(0) 收藏举报