selenium 常用api
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 | ''' 驱动对象<br> http://selenium-python.readthedocs.io/ browser = webdriver.Chrome() browser = webdriver.Firefox() browser = webdriver.Edge() browser = webdriver.PhantomJS() browser = webdriver.Safari() ....等 访问页面 browser = webdriver.Chrome() browser.get('https://www.taobao.com') print(browser.page_source) 打印源码 browser.close() 关闭游览器 查找元素 单个元素 from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.taobao.com') # 4 种方式等价 input_by_id = browser.find_element(By.ID,'q') 查找id 为q By.ID,By.CSS_SELECTOR input_first = browser.find_element_by_id('q') 查找id 为q input_second = browser.find_element_by_css_selector('#q') jq的方法查找id="q" input_third = browser.find_element_by_xpath('//*[@id="q"]') print(input_first, input_second, input_third) browser.close() 查找多个元素 from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.taobao.com') # 第一 lis = browser.find_elements_by_css_selector('.service-bd li') # 选择service-bd 下的 li元素 # 2 lis = browser.find_elements(By.CSS_SELECTOR,'.service-bd li') # 等价的 print(lis) browser.close() ... find_elements_by_name find_elements_by_xpath find_elements_by_tag_name find_elements_by_class_name find_elements_by_css_selector 元素交互操作 from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.taobao.com') input = browser.find_element_by_id('q') input.send_keys('iPhone') time.sleep(1) input.clear() input.send_keys('iPad') button = browser.find_element_by_class_name('btn-search') button.click() 执行javascript from selenium import webdriver browser = webdriver.Chrome() browser.get('https://zhihu.com/explore') browser.execute_script('window.scrollTo(0,document.body.scrollHeight)') browser.execute_script('alert('To Botton')') 获取属性 logo = browser.find_element_by_id('zh-top') print(logo) print(logo.get_attribute('class')) # 打印class属性 获取文本值 input = browser.find_element_by_class_name('zu-top') print(input.text) 获取ID,位置,标签名,大小 input.id input.location # {y:'',x:''} input.tag_name # button input.size # {'height': 22,'width':11} ''' # 元素交互操作 ''' from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://taobao.com') input = browser.find_element_by_id('q') input.send_keys('iPhone') time.sleep(1) input.clear() input.send_keys('iPad') button = browser.find_element_by_class_name('btn-search') button.click() ''' # 执行javascript ''' from selenium import webdriver browser = webdriver.Chrome() browser.get('https://zhihu.com/explore') # 滚到底部 browser.execute_script('window.scrollTo(0,document.body.scrollHeight)') # 弹框 browser.execute_script('alert("I love You")') ''' # iFrame 切换使用(页面内的iframe) ''' import time from selenium import webdriver from selenium.common.exceptions import NoSuchElementException browser = webdriver.Chrome() url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable' browser.get(url) browser.switch_to.frame('iframeResult') # 切换到这个iframe source = browser.find_element_by_css_selector('#draggable') print(source) try: # 在网页的iframe中不能 查找当前iframe之外的元素,需要切换 logo = browser.find_element_by_class_name('logo') # except: except NoSuchElementException as e: print('No Logo') # 切换iframe (切换到父iframe) browser.switch_to.parent_frame() logo = browser.find_element_by_class_name('logo') print(logo) print(logo.text) ''' # 等待... # 隐士等待 ''' from selenium import webdriver browser = webdriver.Chrome() browser.implicitly_wait(10) # 当没有找到元素,会等10秒在进行查找,如果有就不会等 browser.get('https://www.zhihu.com/explore') input = browser.find_element_by_class_name('zu-top-add-question') print(input) ''' # 显示等待 ''' from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC browser = webdriver.Chrome() browser.get('https://www.taobao.com') wait = WebDriverWait(browser, 10) input = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-search'))) print(input) ''' ''' 显示等待的条件 http://selenium-python.readthedocs.io/installation.html title_is 标题是某内容 title_contains 标题包含某内容 presence_of_element_located((By.ID,'p')) 元素加载出,传入定位元组, (By.ID,'p') visibility_of_element_located 元素可见,传入定位元组 visibility_of 可见,传入元素对象 presence_of_all_elements_located 所有元素加载出 text_to_be_present_in_element 某个元素文本包含某个字 text_to_be_present_in_element_value 某个元素值包含某个字 frame_to_be_available_and_switch_to_it ifram加载并切换 invisibility_of_element_located 元素不可见 element_to_be_clickable 元素可点击 staleness_of 判断一个元素是否仍在DOM,可判断页面是否已经刷新 element_to_be_selected 元素可选择,传入定位元组 element_located_to_be_selected 元素可选择,传入定位元组 element_selection_state_to_be 传入元素对象以及状态, 相等返回True,否则返回False element_located_selection_state_to_be 传入定位元组以及状态,相等返回True,否则返回False alert_is_present 是否出现Alert ''' # 游览器前进后退 ''' import time from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.baidu.com') browser.get('https://www.taobao.com') browser.get('https://www.python.org') browser.back() # 后退 time.sleep(1) browser.forward() # 前进 browser.close() ''' # cookie 获取和设置 ''' from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.zhihu.com/explore') # 获取 print(browser.get_cookies()) # 添加 browser.add_cookie({'name': 'name','domain':'www.zhihu.com','value':'germey'}) print(browser.get_cookies()) # 删除 browser.delete_all_cookies() print(browser.get_cookies()) ''' # 选项卡(打开多个页面) ''' import time from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.baidu.com') browser.execute_script('window.open()') print(browser.window_handles) # 当前有几个游览器窗口 browser.switch_to_window(browser.window_handles[1]) # 切换第二个 browser.get('https://www.taobao.com') time.sleep(1) browser.switch_to_window(browser.window_handles[0]) # 切换第一个 browser.get('https://python.org') ''' # 异常处理 ''' id不存在异常 from selenium import webdriver from selenium.common.exceptions import TimeoutException, NoSuchElementException browser = webdriver.Chrome() try: browser.get('https://www.baidu.com') except TimeoutException: print('Time out') try: browser.find_element_by_id('hello') except NoSuchElementException: print("No Element") finally: browser.close() ''' from multiprocessing import Pool |
标签:
python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义