python selenium 下载pdf文件

python selenium 下载pdf文件

功能

python selenium下载链接后面是xxx.pdf的pdf文件,当默认打开链接是,直接默认显示的是pdf文件,例如

image-20230509141558477

代码

import os
import time

from selenium import webdriver

"""
指定默认下载路径, 下载链接是xxx.pdf的链接 如果浏览器直接打开则会显示pdf
https://www.cnblogs.com/lingwang3/p/14440087.html
https://www.codenong.com/81d215683e7fbf0ebd81/
"""
down_load_dir = os.path.abspath("./AAA/BBB/CCC")  # 浏览器会自动创建文件夹 写绝对路径
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ['enable-automation'])
prefs = {
    "download.default_directory": down_load_dir,
    "download.prompt_for_download": False,
    "download.directory_upgrade": True,
    "plugins.always_open_pdf_externally": True
}
options.add_experimental_option('prefs', prefs)
driver = webdriver.Chrome(options=options)
url = 'https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h30/pdf/30daijin.pdf'
driver.get(url)
time.sleep(3)
driver.quit()

注意事项

下载路径要写绝对路径,否则还是会下载到默认路径

下载路径可以自己创建,也可以不创建,浏览器会自动创建

参考链接

https://www.cnblogs.com/lingwang3/p/14440087.html
https://www.codenong.com/81d215683e7fbf0ebd81/

posted @   南风丶轻语  阅读(1182)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 葡萄城 AI 搜索升级:DeepSeek 加持,客户体验更智能
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
历史上的今天:
2022-05-09 Go http库创建Web项目-http库的简单使用
2020-05-09 Python Serial 串口基本操作(收发数据)
点击右上角即可分享
微信分享提示