; ;
摘要: 上一篇使用Java正则表达式来判断和获取图片的链接以及跳转的网址,这篇使用selenium的自带的API(getAttribute)来获取网页中指定的内容 实现内容:获取下面所有图片的链接地址以及跳转地址,使用get请求判断是否有死链 页面内容如图: 页面的源码,需要获取页面的href后的地址,以及 阅读全文
posted @ 2017-08-04 18:13 做梦的人- 阅读(2942) 评论(0) 推荐(0) 编辑
摘要: 任务:通过driver的getPageSource()获取网页的源码内容,在把网页中图片链接地址和跳转的url地址进行过滤,在get每个请求,来判断是否是死链 如图: 获取网页源码中所有的href,以及img src后的链接 代码实现: 调用代码实现,正则表达式 Regular方法,使用正则表达式 阅读全文
posted @ 2017-08-04 18:00 做梦的人- 阅读(1228) 评论(0) 推荐(0) 编辑