使用chromedriver实现豆瓣网页的全网页截图
最近由于工作需要,需要对部分网站进行全文截屏。在网上搜了很久没有搜出好的方法,而且在新版的selenium中已经不在支持PhantomJS了,所以全文截取变得有点棘手。
此处给出一个简单的方法,以20行代码实现selenium+chromedriver+python实现豆瓣的全文截取。
from selenium import webdriver options = webdriver.ChromeOptions() options.add_argument('--headless') options.add_argument('--dns-prefetch-disable') options.add_argument('--no-referrers') options.add_argument('--disable-gpu') options.add_argument('--disable-audio') options.add_argument('--no-sandbox') options.add_argument('--ignore-certificate-errors') options.add_argument('--allow-insecure-localhost') driver = webdriver.Chrome(options=options) driver.get('http://www.douban.com') width = driver.execute_script( "return Math.max(document.body.scrollWidth, document.body.offsetWidth, document.documentElement.clientWidth, document.documentElement.scrollWidth, document.documentElement.offsetWidth);") height = driver.execute_script( "return Math.max(document.body.scrollHeight, document.body.offsetHeight, document.documentElement.clientHeight, document.documentElement.scrollHeight, document.documentElement.offsetHeight);") driver.set_window_size(width + 100, height + 100) driver.save_screenshot('douban.png') driver.close()
以下为截屏效果:
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步