摘要: 使用 selenium + phantomjs 实现 1、准备环境 selenium(一个用于web应用程测试的工具)安装:pip install seleniumphantomjs(是一种无界面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html 阅读全文
posted @ 2018-09-28 15:22 寒爵 阅读(921) 评论(0) 推荐(0) 编辑
摘要: 当我们进行网页爬虫时,我们会利用一定的规则从返回的 HTML 数据中提取出有效的信息。但是如果网页中含有 JavaScript 代码,我们必须经过渲染处理才能获得原始数据。此时,如果我们仍采用常规方法从中抓取数据,那么我们将一无所获。那么,通过Web kit可以简单解决这个问题。Web kit 可以 阅读全文
posted @ 2018-09-28 11:32 寒爵 阅读(5272) 评论(0) 推荐(0) 编辑
摘要: 第一步:下载.whl,地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyqt4,这里可以下载不同的python版本对应的包。 第二步:选择一个目录,将下载好的文件放到该目录下,然后cmd下,cd进入该目录,执行命令:pip install PyQt4- 阅读全文
posted @ 2018-09-28 10:33 寒爵 阅读(4143) 评论(0) 推荐(0) 编辑