HTML 遍历
HTML基本格式:

1.下行遍历:
属性 |
说明 |
contents |
子节点的列表,将所有儿子节点存入列表 |
children |
子节点的迭代类型,与.contents类似,用于循环遍历儿子节点 |
descendants |
子孙节点的迭代类型,包含所有子孙节点,用于循环遍历 |
for child in soup.body.children:
print(child)
for child in soup.body.descendants:
print(child)
2.上行遍历:
属性 |
说明 |
parent |
结点的父亲标签 |
parents |
节点先辈标签的迭代类型,用于循环遍历先辈节点 |
for parent in soup.a.parents:
if parent is None:
print(parent)
else:
print(parent.name)
3. 平行遍历
属性 |
说明 |
next_sibling |
返回按照HTML文本顺序的下一个平行节点标签 |
previous_sibling |
返回按照HTML文本顺序的上一个平行节点标签 |
next_siblings |
迭代类型,返回按照HTML文本顺序的后续所有平行节点标签 |
previous_siblings |
迭代类型,返回按照HTML文本顺序的前续所有平行节点标签 |
注: 平行遍历发生在同一个父节点下的各节点间 |
|
for sibling in soup.a.next_siblings:
print(sibling)
for sibling in soup.a.previous_siblings:
print(sibling)
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步