python使用bs4的BeautifulSoup解析html
使用 bs4 解析数据:
1.将页面源代码(resp.text)交给 BeautifulSoup 进行处理生成 bs 对象
2.从bs对象中查找数据 find(标签, 属性=值)方法(找第一个) 和 find_all(标签, 属性=值)方法(找全部)import requestsfrom bs4 import BeautifulSoup
url = "http://www.xinfadi.com.cn/priceDetail.html" resp = requests.get(url) print(resp.content) # 可以设置响应结果的编码 # resp.encoding = "utf-8" # 使用 bs4 解析数据 # 1.将页面源代码交给 BeautifulSoup 进行处理生成 bs 对象 bs = BeautifulSoup(resp.text) # 2.从bs对象中查找数据 find(标签, 属性=值)方法(找第一个) 和 find_all(标签, 属性=值)方法(找全部) table = bs.find("table") # id 也可以放在 attrs 中 attrs={"id": "myTh"} class为python关键字所以用 class_作为 key thList = table.find_all("th", attrs={}, class_=[]) for t in thList: # 使用 get方法 获取属性值 print(t.get("text")) # get_text() 获取标签里的内容 eg: <p>just for example </p> 返回 just for example print(t.get_text())
欺骗自己最简单,欺骗自己最困难。
安慰自己最简单,安慰自己最困难。
分类:
python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】