摘要: 一 selenium模块 什么是selenium?selenium是Python的一个第三方库,对外提供的接口可以操作浏览器,然后让浏览器完成自动化的操作。 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 seleni 阅读全文
posted @ 2019-01-22 23:07 Mr·Yuan 阅读(944) 评论(0) 推荐(1) 编辑
摘要: 一.正则表达式解析 常用正则表达式回顾: 二 Xpath解析 XPath在Python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但XPath明显比re具有优势,在网页分析上使re退居二线。 测试页面数据 常用xpath表达式 代码中使用xpat 阅读全文
posted @ 2019-01-22 13:23 Mr·Yuan 阅读(839) 评论(0) 推荐(1) 编辑