2020 年 7月 24 日随笔档案 - ʚ追寻家ɞ

2020年7月24日

摘要： python-selenium官方文档 1.driver.current_url：用于获得当前页面的URL 2.driver.title：用于获取当前页面的标题 3.driver.page_source:用于获取页面html源代码 4.driver.current_window_handle:用于获阅读全文

posted @ 2020-07-24 20:14 ʚ追寻家ɞ 阅读(287) 评论(0) 推荐(0) 编辑

Appium

摘要： Appium简明教程/新手入门：http://www.testclass.net/appium Appium 是一个移动 app 自动化工具手机APP自动化： - 自动化完成一些重要性的任务 - 比如微信客服机器人 - 爬虫就是通过自动化爬取信息 - 自动化测试 Appium 自动化特点：开源阅读全文

posted @ 2020-07-24 16:34 ʚ追寻家ɞ 阅读(414) 评论(0) 推荐(0) 编辑

Python+selenium进行浏览器的连接ChromeOptions

摘要：通常我们连接浏览器都是以一个纯净的Chrome来进行操作，平时在使用浏览器的过程中，经常就添加一些插件，扩展，代理之类的应用。相对应的，当我们用chrome浏览器爬取网站时，为了提高效率可能需要对这个chrome做一些特殊的配置，以满足爬虫的行为。常用的行为有： - 禁止图片和视频的加载：提升网页加载速度。 - 添加代理：用于FQ访问某些页面，或者应对IP访问频率限制的反爬技术。 - 使用移动头：访问移动端的站点，一般这种站点的反爬技术比较薄弱。 - 添加扩展：像正常使用浏览器一样的功能。 - 设置编码：应对中文站，防止乱码。 - 阻止JavaScript执行。 ……… 阅读全文

posted @ 2020-07-24 15:05 ʚ追寻家ɞ 阅读(454) 评论(0) 推荐(0) 编辑

小小白的逆袭之路(搬砖ing)

公告