2016 年 12月 6 日随笔档案 - 木白的菜园

2016年12月6日

摘要：

重点介绍了基于Python的Requests HTTP库和BeautifulSoup网页解析库阅读全文

posted @ 2016-12-06 22:41 木白的菜园阅读(6966) 评论(1) 推荐(1) 编辑

摘要：概念爬虫就是对网页的获取。一般获取的网页中又有通向其他网页的通路，我们叫做超链接，那么就可以通过这样的通路获取更多其他的网页，就像一只在网路上爬行的蜘蛛，所以俗称爬虫。爬虫的工作原理和浏览器浏览网页的原理类似，是请求/返回模式，就是说客户端向服务器提出访问某个页面的请求（request），服务阅读全文

posted @ 2016-12-06 21:25 木白的菜园阅读(1141) 评论(0) 推荐(0) 编辑

木白的菜园

保持傻，保持饿，好好种菜，要静候，再静候

公告