2017 年 5月 24 日随笔档案 - fan-tastic

2017年5月24日

摘要：在上文中我们说了：爬虫就是请求网站并提取数据的自动化程序。其中请求，提取，自动化是爬虫的关键！下面我们分析爬虫的基本流程爬虫的基本流程发起请求通过HTTP库向目标站点发起请求，也就是发送一个Request，请求可以包含额外的header等信息，等待服务器响应获取响应内容如果服务器能正常响应，会阅读全文

posted @ 2017-05-24 11:44 fan-tastic 阅读(129353) 评论(6) 推荐(16) 编辑

python爬虫从入门到放弃（一）之初识爬虫

摘要：整理这个文档的初衷是自己开始学习的时候没有找到好的教程和文本资料，自己整理一份这样的资料希望能对小伙伴有帮助什么是爬虫？网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、阅读全文

posted @ 2017-05-24 09:42 fan-tastic 阅读(47087) 评论(8) 推荐(14) 编辑

公告