摘要: 在selenium中,我们会遇到一些问题,就是多窗口处理的问题,我们爬取的内容在一个新窗口上,这个时候,我们就需要先切换到这个新的窗口上,然后进行抓取内容。 如何切换呢? 首先,获取当前窗口句柄 1.元素有属性,浏览器的窗口其实也有属性的,只是你看不到,浏览器窗口的属性用句柄(handle)来识别。 阅读全文
posted @ 2019-01-08 18:30 年轻人——001 阅读(3431) 评论(0) 推荐(0) 编辑
摘要: 我们在定位页面元素的时候呢,经常使用到xpath。xpah定位元素,我们可以使用开发者工具,然后右键选取元素的xpath ,但是这种方式得到的xpath是绝对路径,如果页面元素发生变动,经常会出现定位不到的情况,所以,我们有必要学习一下,手动定位页面元素,既相对定位的写法。 常用的集中规则有: no 阅读全文
posted @ 2019-01-08 15:47 年轻人——001 阅读(1959) 评论(0) 推荐(0) 编辑
摘要: 在爬虫中,我们经常使用xpath来对元素进行定位,xpath定位分为两种,一种是绝对定位,/html/body/div[2]/div[1]/div/div[3]/a[7],另外一种是相对定位,比如r'//*[@id ='ul' ]/a[7]' 通常我们可以通过开发者工具,复制元素对应的xpath,这 阅读全文
posted @ 2019-01-08 14:20 年轻人——001 阅读(18541) 评论(0) 推荐(1) 编辑