摘要: 该随笔主要记录包括urllib、Requests、Selenium、Lxml、Beautifulsoup、pyquery这几个基于爬虫的常用包,主要用于自己的查看和理解,每个包通过2个例子实现对新浪网的新闻和淘宝的图片爬取到本地的测试。 1.urllib(这是python的内置库,是最基础的爬虫实现 阅读全文
posted @ 2018-10-15 20:05 蒙古小铁驴 阅读(645) 评论(0) 推荐(0) 编辑