摘要: Selenium Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。 Selenium 可以根据我们 阅读全文
posted @ 2019-03-11 15:30 岑夫子 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 为什么要学正则表达式 实际上爬虫一共就四个主要步骤: 我们在昨天的案例里实际上省略了第3步,也就是"取"的步骤。因为我们down下了的数据是全部的网页,这些数据很庞大并且很混乱,大部分的东西使我们不关心的,因此我们需要将之按我们的需要过滤和匹配出来。 那么对于文本的过滤或者规则的匹配,最强大的就是正 阅读全文
posted @ 2019-03-11 14:27 岑夫子 阅读(612) 评论(0) 推荐(0) 编辑