爬虫_selenium_访问元素信息及交互
1.访问元素信息
获取元素属性
.get_attribute('class')
获取元素文本
.text
获取标签名
.tag_name
from selenium import webdriver from selenium.webdriver.common.by import By path = 'chromedriver.exe' browser = webdriver.Chrome(path) url = 'http://www.baidu.com' browser.get(url) input = browser.find_element(By.ID,"su") # 获取标签的属性 print(input.get_attribute('class')) # 获取标签的名称 print(input.tag_name) #获取元素文本 a = browser.find_element(By.PARTIAL_LINK_TEXT,"新闻") print(a.text)
2.交互
点击:click()
输入:send_keys()
后退操作:browser.back()
模拟JS滚动:
js='document.documentElement.scrollTop=100000'
browser.execute_script(js) 执行js代码
获取网页代码:page_source
退出:browser.quit()
#利用selenium自动交互百度 from selenium import webdriver from selenium.webdriver.common.by import By #创建浏览器对象 path = 'chromedriver.exe' browser= webdriver.Chrome(path) #url url= 'https://www.baidu.com' browser.get(url) import time time.sleep(2) #获取文本框的对象 input = browser.find_element(By.ID,'kw') #在文本框中输入”周杰伦“ input.send_keys('周杰伦') time.sleep(2) #获取百度一下的按钮 button = browser.find_element(By.ID,'su') #点击搜索按钮 button.click() time.sleep(2) #滑倒底部 js_bottom ='document.documentElement.scrollTop=100000' browser.execute_script(js_bottom) time.sleep(2) #获取下一页的按钮 next = browser.find_element(By.XPATH,'//a[@class="n"]') #点击下一页 next.click()
源代码地址:https://gitee.com/heating-cloud/python_spider.git
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!