文章分类 -  自动化测试

摘要:一、强制等待:sleep()import timesleep(5) #等待5秒 设置固定休眠时间,单位为秒。 由python的time包提供, 导入 time 包后就可以使用。缺点:不智能,使用太多的sleep会影响脚本运行速度。 二、隐式等待:implicitly_wait()driver.imp 阅读全文
posted @ 2021-10-27 16:11 rmticocean 阅读(702) 评论(0) 推荐(0) 编辑
摘要:1.问题 自从发现 Selenium 这块新大陆后,许多异步加载、js加密、动态Cookie等问题都变得非常简单,大大简化了爬虫的难度。但是有些时候使用 Selenium 仍然有一些缺陷,比如现在很多网站数据都是通过json结构的接口来交互,通过分析报文的方式直接发包可以直接拿到json数据,数据不 阅读全文
posted @ 2021-10-26 17:24 rmticocean 阅读(2309) 评论(0) 推荐(0) 编辑
摘要:页面性能监控 很多公司都会做页面性能的检测,做的方法也非常多。其实比较简单的是利用js去做,js可以很方便的调取浏览器的api,获取network里的相关信息,这个资料还是比较多的。唯一的难点在于如何注入js脚本,业内的方法的普遍有两种 利用selenium的execute_script,注入js脚 阅读全文
posted @ 2021-10-22 15:15 rmticocean 阅读(1347) 评论(0) 推荐(0) 编辑
摘要:Python之Selenium神坑踩记录在之前,我总结过一些关于selenium的常用操作。本以为这就是它的全部了,然而I am wrong!这东西比我想象的要强大的多。本期带来的知识主要有: 关于代理认证框的处理问题浏览器获取后台日志浏览器Cookie操作跳过登录没错,就是这些东西,每一个问题都让 阅读全文
posted @ 2021-10-22 15:14 rmticocean 阅读(757) 评论(0) 推荐(0) 编辑
摘要:问题描述通过selenium请求目标网站时候, 真实数据(我这里是验证码图片)已经加载出来, 由于网站做了第三方上报所以得等待很久, 但是上报这个请求不是必须的. 例如验证码已经加载完成, 但是huatuo.qq.com响应时间过长 , webdriver.get()的机制是等待请求的url响应全部 阅读全文
posted @ 2021-10-22 14:33 rmticocean 阅读(751) 评论(0) 推荐(0) 编辑
摘要:有更简单的方式,不用这么复杂的,自行百度 本文仅是获取验证码图片,python+selenium实现 图片的处理,算出偏移位置网上都有现成的;而由于b站的更新,图片的获取则与之前完全不同,不能直接从html中拿到 过程比较曲折所以记录一下,可能比较长 从分析的过程来展开,刚开始的分析最终发现有些问题 阅读全文
posted @ 2021-10-22 11:29 rmticocean 阅读(15219) 评论(0) 推荐(1) 编辑
摘要:1.通过selenium.webdriver.support.ui的Select进行定位 下拉菜单如下图: 定位代码(选择Male): ...from selenium.webdriver.support.ui import Select... # 通过index进行选择 Select(driver 阅读全文
posted @ 2021-01-22 21:11 rmticocean 阅读(515) 评论(0) 推荐(0) 编辑
摘要:1.关闭浏览器全部标签页 driver.quit() 2.关闭当前标签页(从标签页A打开新的标签页B,关闭标签页A) driver.close() 3.关闭当前标签页(从标签页A打开新的标签页B,关闭标签页B) 可利用浏览器自带的快捷方式对打开的标签进行关闭 Firefox自身的快捷键分别为: Ct 阅读全文
posted @ 2020-06-08 16:03 rmticocean 阅读(1911) 评论(0) 推荐(0) 编辑
摘要:1. 背景目前爬虫解析网页的技术有:Json, 正则表达式,BeautifulSoup,PyQuery,XPathXPath 教程 官方文档: http://www.w3school.com.cn/xpath/index.asp2. XPath简述2.1. 什么是XPath?XPath (XML P 阅读全文
posted @ 2019-10-09 15:42 rmticocean 阅读(1531) 评论(0) 推荐(0) 编辑
摘要:xpath是一种在xm文档中定位的语言,详细简介,请自行参照百度百科,本文主要总结一下xpath的使用方法,个人看法,如有不足和错误,敬请指出。 注意:xpath的定位 同一级别的多个标签 索引从1开始 而不是0 1. 绝对定位: 此方法最为简单,具体格式为 xxx.find_element_by_ 阅读全文
posted @ 2019-10-09 15:40 rmticocean 阅读(221) 评论(0) 推荐(0) 编辑
摘要:栗 子 1、id 获取id 的属性值 2、starts-with 顾名思义,匹配一个属性开始位置的关键字 -- 模糊定位 3、contains 匹配一个属性值中包含的字符串 -- 模糊定位 4、text() 函数文本定位 5、last() 函数位置定位 eg <a id="setf" href="/ 阅读全文
posted @ 2019-09-29 16:34 rmticocean 阅读(3505) 评论(1) 推荐(1) 编辑
摘要:https://www.jianshu.com/p/01b9782d72b3 https://blog.csdn.net/snailandfish/article/details/80034458 https://www.cnblogs.com/windanchaos/p/6398798.html 阅读全文
posted @ 2019-04-02 14:22 rmticocean 阅读(163) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示