python-requests-html

# 1. 安装
pip install requests-html
# 2. 使用Requests向python.org发出 GET 请求:
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://python.org/')
# 3. 使用
about=r.html.find('.nav_list',first=True) # Element使用 CSS 选择器选择一个
print(about.text) # 抓取 anElement的文本内容
print(about.attrs) # anElement的属性
print(about.html) # 渲染一个Element的 HTML:
print(about.find(".this")) # 在 中选择一个Element列表Element
print(about.absolute_links) # 搜索元素内的链接
print(r.html.search('拆单{}情')[0])# 在页面上搜索文本,固定格式
```
posted @   测试圈的彭于晏  阅读(199)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示