摘要:
一、代理池搭建 1、频繁爬网站,ip容易被封 # ip代理 -每个设备都会有自己的IP地址 -电脑有ip地址 》访问一个网站 》访问太频繁 》封ip -收费:靠谱稳定--提供api -免费:不稳定--自己写api用 -开源的:https://github.com/jhao104/proxy_pool 阅读全文
摘要:
一、爬虫介绍 1、作用 使用程序 模拟发送http请求 》得到http响应 》把响应的数据解析出来 》存储起来 2、做爬虫需要掌握的技术 web端爬虫(网页) -抓包: -抓包工具 》浏览器,charles,fiddler。。。 -发送http请求的模块 -requests:同步的 》不仅仅做爬虫用 阅读全文