selenium爬虫京东商品信息
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time
try:
bro = webdriver.Chrome(executable_path='chromedriver_mac64')
bro.get('https://www.jd.com/')
bro.implicitly_wait(10)
bro.maximize_window()
search_btn = bro.find_element(By.ID, value='key')
search_btn.send_keys('茅台')
search_btn.send_keys(Keys.ENTER)
1.获取到搜索框 输入 茅台 并 按下回车
time.sleep(2)
bro.execute_script('scrollTo(0,5000)')
2.将网页下滑到5000px位置 这样可以加载出更多的商品
time.sleep(2)
goods_list = bro.find_elements(By.CLASS_NAME, value='gl-item')
3.拿到所有的商品标签列表
for goods in goods_list:
try:
img = goods.find_element(By.CSS_SELECTOR, value='.p-img img').get_attribute('src')
4.获取每一个商品的图片地址,前端有懒加载为加载的我们可以通过其他属性获取
if not img:
img = 'https://' + goods.find_element(By.CSS_SELECTOR, value='.p-img img').get_attribute(
'data-lazy-img')
url = goods.find_element(By.CSS_SELECTOR, value='.p-img a').get_attribute('href')
price = goods.find_element(By.CSS_SELECTOR, value='.p-price i').text
name = goods.find_element(By.CSS_SELECTOR, value='.p-name em').text 5.获取商品名称,发现在.p-name类属性标签下的 em 标签 内的所有文本信息
shop = goods.find_element(By.CSS_SELECTOR, value='.p-shop a').text
print('''
商品名:%s,
图片地址:%s,
价格:%s,
店铺:%s,
'''%(name,img,price,shop))
except Exception:
continue
except Exception as e:
print(e)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· DeepSeek 开源周回顾「GitHub 热点速览」
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了