偶然路过的靓仔-胡阳

为中华之崛起而读书!中国加油! 问题不能及时回答,有需要的话加微信:921308494

   ::  ::  ::  ::  :: 管理
  113 随笔 :: 0 文章 :: 0 评论 :: 33774 阅读

安装beautifulsoup

pip install beautifulsoup4

 

 

简单代码示例:

import requests  #导入requests包
from bs4 import BeautifulSoup #导入beautifulsoup 包


def getit():
r=requests.get('https://www.baidu.com/')

page=r.content #获取页面全部

Bsoup=BeautifulSoup(page,"html.parser") #解析成一行行树形代码

print(Bsoup.prettify()) #解析成带缩进 可读的一行行树形代码

result=Bsoup.find_all('a',class_="mnav") #检索 a标签 class为mnav
  
  #result为list类型,可以for循环遍历读取数据,也可以用re读取数据
for i in result:
print(i,'取值:',i['href'],i['name'],i.string)

def sava_data():
#保存在txt
#保存在excel
#保存到数据库
pass

if __name__ == '__main__':
getit()
  ...

运行结果:

 


 



posted on   偶然路过的靓仔-胡阳  阅读(45)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
点击右上角即可分享
微信分享提示