随笔分类 - selenium
selenium的学习记录
摘要:之前有一篇文章介绍过在ubuntu下安装selenium和firefox 现在介绍下centos7 注意以下都是下载的linux64位的软件,32位的请自己找下链接, 现在使用的python的版本是3,请注意,2应该也可以运行 需要的版本有 firefox 57.0.4 cd /usr/local/
阅读全文
摘要:请确保selenium已经安装成功,没安装的可以pip install selenium 安装chrome 在终端输入 下载安装包 wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb 58 wg
阅读全文
摘要:场景 Expected Conditions的使用场景有2种 直接在断言中使用 与WebDriverWait配合使用,动态等待页面上元素出现或者消失 方法注释 先翻译一下这些方法的用法 title_is: 判断当前页面的title是否精确等于预期 title_contains: 判断当前页面的tit
阅读全文
摘要:序 使用 selenium 时,我们可能需要对 chrome 做一些特殊的设置,以完成我们期望的浏览器行为,比如阻止图片加载,阻止JavaScript执行 等动作。这些需要 selenium的 ChromeOptions 来帮助我们完成 什么是 chromeoptions chromeoptions
阅读全文
摘要:这些坑分别是: 有些地方只告诉你配置network.proxy.http和network.proxy.http_port。但是如果不设置network.proxy.type,一切都是浮云。这个配置是个整数,默认是0,就是直接连接;1就是手工配置代理。profile.set_preference(‘n
阅读全文
摘要:ubuntu16.041安装pythonsudo apt-get install python默认2.7.122更新apt-getsudo apt-get update更新下apt-get库否则下载pip会出错3安装pipsudo apt-get install python-pip默认是8.1.1
阅读全文
摘要:废话不多说,直接上代码 from selenium import webdriver browser = webdriver.xx() browser.get(url) browser.swith_to.frame(frameid)#切换到iframe中 browser.findxxx()#查找元素
阅读全文
摘要:在爬虫过程中经常遇到验证码,如何处理验证码就显得很重要 现在来说貌似没有完美的解决方案,很多都是通过第三方平台来实现验证码的验证 将获取的验证码的url发送到第三方平台,接收平台返回的验证码,貌似很简单的样子。 这只是对静态的验证码的一种处理手段,如果遇到动态的验证码怎么办呢? 你看到的验证码和发给
阅读全文
摘要:from selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsbrowser = webdriver.Firefox()browser.get('https://www.ba
阅读全文
摘要:webdriver类中有三个和时间相关的方法: 1.pageLoadTimeout 2.setScriptTimeout 3.implicitlyWait from selenium import webdriver driver = webdriver.firefox() driver.set_p
阅读全文
摘要:背景知识: phantomjs是一个基于webkit的没有界面的浏览器,所以运行起来比完整的浏览器要高效。 selenium是一个测试web应用的工具,目前是2.42.1版本,和1版的区别在于2.0+中把WebDrive整合在了一起。 selenium2支持的Python版本:2.7, 3.2, 3
阅读全文
摘要:from selenium import webdriverbrowser = webdriver.PhantomJS(executable_path="D:\PhantomJS\phantomjs-2.1.1-windows\bin\phantomjs") 报错“Unable to start p
阅读全文
摘要:element = self.brower.find_element_by_id(‘xxx’)brower.execute_script('arguments[0].scrollIntoView();', element)让滚动条滚动到element的位置
阅读全文
摘要:webdriver三种等待方法 1.使用WebDriverWait from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import W
阅读全文
摘要:selenium webdriver定位不到元素的五种原因及解决办法 1.动态id定位不到元素 for example: //WebElement xiexin_element = driver.findElement(By.id("_mail_component_82_82")); WebElem
阅读全文
摘要:browser = webdriver.Firefox()browser是一个WebDriver类,常用的方法有 'add_cookie',添加cookie 'back',返回上一页 'close',退出当前窗口,和quit有区别, 'current_url',查看当前url,'current_wi
阅读全文