随笔分类 - 爬虫
摘要:1. 什么是爬虫和反爬虫? 爬虫:使用任何技术手段,批量获取网站信息的一种方式。 反爬虫:使用任何技术手段,阻止别人批量获取自己网站信息的一种方式。 2. 常见的反爬虫机制 通过UA 识别爬虫 有些爬虫的UA是特殊的,与正常浏览器的不一样,可通过识别特征UA,直接封掉爬虫请求 设置IP访问频率,如果
阅读全文
摘要:python 爬虫资源包汇总 Requests BeautifulSoup Beautiful Soup库(bs4)入门 Selenium Selenium环境安装设置 Selenium Installation Python爬虫利器五之Selenium的用法 Python爬虫利器三之Xpath语法
阅读全文
摘要:https://www.cnblogs.com/new-june/p/9249903.html
阅读全文