摘要:
python-selenium官方文档 1.driver.current_url:用于获得当前页面的URL 2.driver.title:用于获取当前页面的标题 3.driver.page_source:用于获取页面html源代码 4.driver.current_window_handle:用于获 阅读全文
摘要:
Appium简明教程/新手入门:http://www.testclass.net/appium Appium 是一个移动 app 自动化工具 手机APP自动化: - 自动化完成一些重要性的任务 - 比如微信客服机器人 - 爬虫 就是通过自动化爬取信息 - 自动化测试 Appium 自动化特点: 开源 阅读全文
摘要:
通常我们连接浏览器都是以一个纯净的Chrome来进行操作,平时在使用浏览器的过程中,经常就添加一些插件,扩展,代理之类的应用。相对应的,当我们用chrome浏览器爬取网站时,为了提高效率可能需要对这个chrome做一些特殊的配置,以满足爬虫的行为。
常用的行为有:
- 禁止图片和视频的加载:提升网页加载速度。
- 添加代理:用于FQ访问某些页面,或者应对IP访问频率限制的反爬技术。
- 使用移动头:访问移动端的站点,一般这种站点的反爬技术比较薄弱。
- 添加扩展:像正常使用浏览器一样的功能。
- 设置编码:应对中文站,防止乱码。
- 阻止JavaScript执行。
……… 阅读全文