摘要: 重点介绍了基于Python的Requests HTTP库和BeautifulSoup网页解析库 阅读全文
posted @ 2016-12-06 22:41 木白的菜园 阅读(6966) 评论(1) 推荐(1) 编辑
摘要: 概念 爬虫就是对网页的获取。 一般获取的网页中又有通向其他网页的通路,我们叫做超链接,那么就可以通过这样的通路获取更多其他的网页,就像一只在网路上爬行的蜘蛛,所以俗称爬虫。 爬虫的工作原理和浏览器浏览网页的原理类似,是请求/返回模式,就是说客户端向服务器提出访问某个页面的请求(request),服务 阅读全文
posted @ 2016-12-06 21:25 木白的菜园 阅读(1141) 评论(0) 推荐(0) 编辑