摘要: 官方学习文档:http://selenium-python.readthedocs.io/api.html 一、什么是Selenium? 答:自动化测试工具,支持多种浏览器。用来驱动浏览器,发出指令让浏览器做出各种动作,如下拉,跳转等。 爬虫中主要用来解决JavaScript渲染的问题。 注:如果用 阅读全文
posted @ 2018-08-02 23:06 CTHON 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 官方学习文档:http://pyquery.readthedocs.io/en/latest/api.html 一、什么是PyQuery? 答:强大有灵活的网页解析库,模仿jQuery实现。如果你觉得正则表达式写起来太麻烦,如果你觉的BeautifulSoup语法太难记,如果你熟悉jQuery的语法 阅读全文
posted @ 2018-08-02 22:23 CTHON 阅读(740) 评论(0) 推荐(0) 编辑
摘要: 官方学习文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ 一、什么时BeautifulSoup? 答:灵活又方便的网页解析库,处理搞笑,支持多种解析器。 利用它不用编写正则表达式即可方便地实现网页信息的提取。 二、安装 三、用法 阅读全文
posted @ 2018-08-02 00:00 CTHON 阅读(593) 评论(0) 推荐(0) 编辑