文章分类 - DrissionPage
摘要:一、采集猫眼电影榜 1.1.采集目标 目标网址:https://www.maoyan.com/board/4 采集目标:排名、电影名称、演员、上映时间、分数 1.2.编码思路 按F12,可以看到每个电影信息都包含在<dd>元素中,因此可批量获取<dd>元素,遍历它们并再从其中 from Drissi
阅读全文
摘要:一、文件下载说明 DrissionPage 提供了强大的文件下载管理功能。 能够主动发起下载任务,也能够对浏览器触发的下载任务进行管理。 1.1.download()方法 该方法可以主动发起下载任务,提供任务管理、多线程、大文件分块、自动重连、文件名冲突处理等功能。页面对象、标签页对象、<ifram
阅读全文
摘要:一、WebPage是什么? WebPage对象整合了SessionPage和ChromiumPage,实现了两者之间的互通。 既可以操控浏览器,也可以收发数据包,并且会在两者之间同步登录信息。 有 d 和 s 两种模式,分别对应操控浏览器和收发数据包。 WebPage可灵活的在两种模式间切换,从而实
阅读全文
摘要:一、点击元素 click()和click.left() 这两个方法作用是一样的,用于左键点击元素。可选择模拟点击或 js 点击。 参数: 数名称类型默认值说明 by_js bool False 指定点击行为方式。为None时,如不被遮挡,用模拟点击,否则用 js 点击为True时直接用 js 点击;
阅读全文
摘要:一、ChromiumPage是什么? ChromiumPage对象和WebPage对象的 d 模式,可操控浏览器。ChromiumPage是 Chromium 内核浏览器的页面,它用 POM 方式封装了操控网页所需的属性和方法。使用它,我们可与网页进行交互,如调整窗口大小、滚动页面、操作弹出框等等。
阅读全文
摘要:一、SessionPage是什么? SessionPage对象和WebPage对象的 s 模式,可用收发数据包的形式访问网页。 顾名思义,SessionPage是一个使用使用Session(requests 库)对象的页面,它使用 POM 模式封装了网络连接和 html 解析功能,使收发数据包也可以
阅读全文
摘要:一、在结果列表中筛选 eles()、nexts()等能够获取多个元素的方法,返回的列表可进行进一步筛选,以获取指定的元素。 示例1,筛选并返回元素列表: from DrissionPage import ChromiumPage page = ChromiumPage() page.get('htt
阅读全文
摘要:一、基本用法 所有页面对象和元素对象(包括<iframe>和 shadow-root),都可以在自己内部查找元素。元素对象还能以自己为基准,相对定位其它元素。定位元素大致有以下几种方法,将在后续小节中详细说明。 在页面或元素内查找子元素 根据 DOM 结构相对定位 根据视觉位置相对定位 所有的查找
阅读全文
摘要:一、概述 DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能收发数据包,还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大,内置无数人性化设计和便捷功能。它的语法简洁而优雅,代码量少,对新手友好。 二、主要功能 集成
阅读全文