爬虫_selenium_访问元素信息及交互

1.访问元素信息

获取元素属性

  .get_attribute('class')

获取元素文本

  .text

获取标签名

  .tag_name

from selenium import webdriver
from selenium.webdriver.common.by import By

path = 'chromedriver.exe'
browser = webdriver.Chrome(path)

url = 'http://www.baidu.com'
browser.get(url)

input = browser.find_element(By.ID,"su")

# 获取标签的属性
print(input.get_attribute('class'))
# 获取标签的名称
print(input.tag_name)

#获取元素文本
a = browser.find_element(By.PARTIAL_LINK_TEXT,"新闻")
print(a.text)

2.交互

点击:click()

输入:send_keys()

后退操作:browser.back()

模拟JS滚动:

  js='document.documentElement.scrollTop=100000'

  browser.execute_script(js) 执行js代码

获取网页代码:page_source

退出:browser.quit()

#利用selenium自动交互百度
from selenium import webdriver
from selenium.webdriver.common.by import By
#创建浏览器对象
path = 'chromedriver.exe'
browser= webdriver.Chrome(path)

#url
url= 'https://www.baidu.com'
browser.get(url)

import time
time.sleep(2)

#获取文本框的对象
input = browser.find_element(By.ID,'kw')

#在文本框中输入”周杰伦“
input.send_keys('周杰伦')

time.sleep(2)

#获取百度一下的按钮
button = browser.find_element(By.ID,'su')

#点击搜索按钮
button.click()

time.sleep(2)

#滑倒底部
js_bottom ='document.documentElement.scrollTop=100000'
browser.execute_script(js_bottom)

time.sleep(2)

#获取下一页的按钮
next = browser.find_element(By.XPATH,'//a[@class="n"]')
#点击下一页
next.click()

 

 

 

源代码地址:https://gitee.com/heating-cloud/python_spider.git

posted @ 2022-05-26 15:43  创客未来  阅读(46)  评论(0编辑  收藏  举报