爬虫之Cookie获取:利用浏览器模拟一个cookie出来、面对反爬虫、加密的cookie的应对方法
- 在爬虫或模拟请求时,特别是获取验证码的时候,反爬虫的网站的cookie或定期失效,复制出来使用是不行的
- 为了应对这种方式,我们可能就需要像浏览器打开网站一样,取得它信任的cookie
- selenium就是一个很好的手段
一、什么是selenium
- Selenium最初是一个自动化测试工具,Selenium可以驱动浏览器自动执行自定义好的逻辑代码,即通过代码完全模拟使用浏览器自动访问目标站点并操作,所以也可以用来爬虫。
二、准备工作
- 安装Chrome
- 下载对应版本的chromedriver.exe
2.1 chrome 查看版本
chrome://version/

2.2 下载对应版本的chromedriver.exe
- 上下2图的版本号要对应上(最新版本的chrome的driver可能还没有)

2.3 一组对应上的chrome和driver
- 微信搜索“数字续坚”,在“资源”TAB页面,输入“selenium”,然后复制百度网盘的下载地址
- 注意:chrome会自动更新,建议安装chrome前,先在hosts文件中加入如下内容,屏蔽chrome的自动升级
127.0.0.1 update.googleapis.com
三、编码实现
String targetUrl = "https://www.baidu.com";
System.setProperty("webdriver.chrome.driver", "./chromedriver100.exe");
ChromeDriver chromeDriver =new ChromeDriver();
chromeDriver.get(url);
Set<Cookie> cookies = chromeDriver.manage().getCookies();
String cookieStr = "";
for (Cookie cookie : cookies) {
cookieStr += cookie.getName() + "=" + cookie.getValue() + ";";
}
System.out.println(cookieStr);
- 针对其他语言、其他系统或不想配置chrome+driver的兄弟,这里提供了快速获取的办法
- 见文档。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?