Chrome如何设定webdriver=undefined以避免Selenium检测?
Chrome如何设定webdriver=undefined以避免Selenium检测?
一、WebDriver规范
根据WebDriver规范(https://w3c.github.io/webdriver/#x4-interface)的描述,WebDriver定义了一个标准方法,以便于文档(document)判断当前浏览器处于自动化控制之中。
这个方法就是检测window.navigator.webdriver的值,正常情况下其值为undefined
,自动化控制下为true
。注意,正常情况下不是false
,在JavaScript中undefined
为未定义,即该值不存在,而false
表示一布尔值。
附上规范原文:
The webdriver-active flag is set to true when the user agent is under remote control. It is initially false.
Defines a standard way for co-operating user agents to inform the document that it is controlled by WebDriver, for example so that alternate code paths can be triggered during automation.
二、突破
ChromeDriver的设计符合这一规范,如何突破
?
旧版本
在版本79.0.3945.16
之前,可用如下方法:
#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option("useAutomationExtension", False)
driver = webdriver.Chrome(options=options)
driver.get("YOUR_URL")
# 在控制台中验证window.navigator.webdriver的值为undefined。
driver.quit()
新版本
在版本79.0.3945.16
之后,ChromeDriver修正了这一“问题”。
根据注记原文:
Resolved issue 3133: window.navigator.webdriver is undefined when "enable-automation" is excluded in non-headless mode (should be true) [Pri-2]
如何突破
?
execute_cdp_cmd函数来帮忙!cdp即Chrome DevTools Protocal,Chrome开发者工具协议。
通过该函数在文档加载前注入一段js代码以消去webdriver值。
#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
from selenium import webdriver
driver = webdriver.Chrome()
script = '''
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
'''
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": script})
driver.get("YOUR_URL")
# 在控制台中验证window.navigator.webdriver的值为undefined。
driver.quit()