摘要: 简介 这篇文章主要介绍selenium的多层框架定位。案例是使用selenium自动登陆QQ空间。 思路 1 使用selenium自动请求QQ空间网站 https://i.qq.com/ 。打开后出现如下页面。 2 通过xpath定位到账号密码登录的位置,然后使用click点击对象。出现如下页面。 阅读全文
posted @ 2020-07-05 23:58 菜鸟峰 阅读(1099) 评论(0) 推荐(0) 编辑
摘要: 基础知识 1 js:JavaScript缩写 json:JavaScript的一种数据格式 2 浏览器的原理:把 html+css+js 下载到本地然后再进行渲染。即看到网页这个过程,实际上是浏览器把代码下载下来,然后浏览器来解释这个代码,变成界面的过程。 3 查看网页源代码:就是别人服务器发送到浏 阅读全文
posted @ 2020-07-05 19:49 菜鸟峰 阅读(2646) 评论(0) 推荐(1) 编辑
摘要: 简介 在爬取网页时,一般都会用到代理IP。蘑菇代理网站:http://www.moguproxy.com/ 蘑菇代理的代理IP有两种:API私密代理和隧道转发代理,这篇文章主要介绍隧道转发代理 。 在官网购买隧道转发代理后,就可以到订单页面查看购买订单的Appkey。如果是第一次使用,那么需要添加白 阅读全文
posted @ 2020-07-05 00:51 菜鸟峰 阅读(1550) 评论(0) 推荐(0) 编辑