爬虫_selenium_访问元素信息及交互

1.访问元素信息

获取元素属性

　　.get_attribute('class')

获取元素文本

　　.text

获取标签名

　　.tag_name

from selenium import webdriver
from selenium.webdriver.common.by import By

path = 'chromedriver.exe'
browser = webdriver.Chrome(path)

url = 'http://www.baidu.com'
browser.get(url)

input = browser.find_element(By.ID,"su")

# 获取标签的属性
print(input.get_attribute('class'))
# 获取标签的名称
print(input.tag_name)

#获取元素文本
a = browser.find_element(By.PARTIAL_LINK_TEXT,"新闻")
print(a.text)

2.交互

点击：click()

输入：send_keys()

后退操作：browser.back()

模拟JS滚动：

　　js='document.documentElement.scrollTop=100000'

　　browser.execute_script(js) 执行js代码

获取网页代码：page_source

退出：browser.quit()

#利用selenium自动交互百度
from selenium import webdriver
from selenium.webdriver.common.by import By
#创建浏览器对象
path = 'chromedriver.exe'
browser= webdriver.Chrome(path)

#url
url= 'https://www.baidu.com'
browser.get(url)

import time
time.sleep(2)

#获取文本框的对象
input = browser.find_element(By.ID,'kw')

#在文本框中输入”周杰伦“
input.send_keys('周杰伦')

time.sleep(2)

#获取百度一下的按钮
button = browser.find_element(By.ID,'su')

#点击搜索按钮
button.click()

time.sleep(2)

#滑倒底部
js_bottom ='document.documentElement.scrollTop=100000'
browser.execute_script(js_bottom)

time.sleep(2)

#获取下一页的按钮
next = browser.find_element(By.XPATH,'//a[@class="n"]')
#点击下一页
next.click()

源代码地址：https://gitee.com/heating-cloud/python_spider.git

posted @ 2022-05-26 15:43 创客未来阅读(63) 评论(0) 收藏举报

刷新页面返回顶部

创客未来

爬虫_selenium_访问元素信息及交互

1.访问元素信息

2.交互

公告