摘要:
HTML基本格式(树型格式): 遍历方式:下行遍历(根节点到叶节点),上行遍历(叶节点到根节点),平行遍历 标签树的下行遍历: 属性 说明 .contents 子节点的列表,将<tag>所有儿子节点存入列表 .children 子节点的迭代类型,与.contents类似,用于循环遍历儿子节点 .de 阅读全文
摘要:
爬取某图片的程序: #图片爬取全代码 import requests import os url='http://img0.dili360.com/rw9/ga/M01/4A/3D/wKgBy1p6qJ6ALyaOADWDaIwa9uw587.tub.jpg' root='D:/北理工爬虫课程/' 阅读全文
摘要:
bs4有一个find_all(name,attrs,recursive,string,**kwargs)方法,返回一个列表类型,存储查找的结果 name 对标签名称的检索字符串 attrs 对标签属性值的检索字符串,可标注属性检索,可查找某标签中是否含有特定的字符串 recursive 是否对子孙全 阅读全文