摘要: 爬虫之request模块 request简介 基于GET请求 基本请求 带参数的get请求 headers 请求头 User Agent 我们要用爬虫来爬取数据究其本质就是通过脚本模拟浏览器来进行操作,在任何一个html界面我们通过f12来调用代码,通过network选项来找到请求头进行操作! 一般 阅读全文
posted @ 2018-01-11 18:38 DaMoWang 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 一、什么是爬虫 如果我们把互联网比作一张大的蜘蛛网,那一台计算机上的数据便是蜘蛛网上的一个猎物,而爬虫程序就是一只小蜘蛛,沿着蜘蛛网抓取自己想要的猎物/数据 爬虫的基本定义 向网站发起请求,获取资源后分析并提取有用数据的程序 爬虫的基本流程 发送请求 获取响应内容 解析内容 保存数据 如下 请求与响 阅读全文
posted @ 2018-01-11 16:28 DaMoWang 阅读(148) 评论(0) 推荐(0) 编辑