2018年5月21日
摘要: 简介 有时候,我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现,我们要提取的网页元素并不在我们下载到的HTML之中,尽管它们在浏览器里看起来唾手可得。 这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子,我们在刷QQ空间或者微博评论的时候,一直往下刷,网页 阅读全文
posted @ 2018-05-21 23:39 小学森也要学编程 阅读(630) 评论(0) 推荐(0) 编辑
摘要: 简介 pyquery 可让你用 jQuery 的语法来对 xml 进行操作。这I和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。 初始化 在这里介绍四种初始化方式。 (1)直接字符串 pq 参数可以直接传入 HTML 代码,doc 现在就相当于 阅读全文
posted @ 2018-05-21 15:54 小学森也要学编程 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 简介 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里面安装一个 Selenium 的插件,那么便可以方便地实现Web界面的测试。换句话说叫 Selenium 支持这些浏览器驱动。 安装 首 阅读全文
posted @ 2018-05-21 15:31 小学森也要学编程 阅读(342) 评论(0) 推荐(0) 编辑