Python使用Selenium控制Chrome浏览器(web自动化)
环境windows10 anaconda python2.7 selenium
自己Chrome浏览器和chromedriver版本必须保持一致
(自己下载https://chromedriver.storage.googleapis.com/index.html)
我使用的是最新版8.0.41417
1、将下载后的webdriver包解压到文件夹,将该文件夹添加到系统环境变量
2、使用python导入selenium
#coding=utf8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
option=Options()
#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口
browser = webdriver.Chrome(chrome_options=option,executable_path="D:\webriver\chromedriver.exe")
#通过浏览器向服务器发送URL请求
browser.get("http://baidu.com")
(若要爬取页面啥的被webdriver这个东西检测到了,加入下面这个)
#去除webdriver标记不被检测到
browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": """
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
"""
})
其他操作太多不一个个写出来了,百度,按需取用
效果如图
本文来自博客园,作者:HumorChen99,转载请注明原文链接:https://www.cnblogs.com/HumorChen/p/18039725
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~