随笔 - 300 文章 - 60 评论 - 259 阅读 - 128万

2018年1月15日

摘要：一、介绍二、基于GET请求 1、基本请求 2、带参数的GET请求->params 1 #在请求头内将自己伪装成浏览器，否则百度不会正常返回页面内容 2 import requests 3 response=requests.get('https://www.baidu.com/s?wd=pytho 阅读全文

posted @ 2018-01-15 21:56 海燕。阅读(1491) 评论(0) 推荐(1) 编辑

爬虫基本原理

摘要：一、爬虫是什么? 二、爬虫的基本流程三、请求与响应四、Request 五、Response 六、总结一、爬虫是什么? 二、爬虫的基本流程三、请求与响应四、Request 1 import requests 2 from urllib.parse import urlencode 3 # 请阅读全文

posted @ 2018-01-15 21:13 海燕。阅读(15383) 评论(4) 推荐(4) 编辑

爬虫学习目录

摘要：阅读目录第一篇：爬虫基本原理第二篇：请求库之requests,selenium 第三篇：解析库之re、beautifulsoup、pyquery 第四篇：存储库之mongodb、redis、mysql 第五篇：爬虫高性能相关第六篇：Scrapy框架第七篇：爬虫实战 1、破解滑动验证码 2、投阅读全文

posted @ 2018-01-15 19:36 海燕。阅读(4560) 评论(1) 推荐(1) 编辑