摘要: HTML基本格式(树型格式): 遍历方式:下行遍历(根节点到叶节点),上行遍历(叶节点到根节点),平行遍历 标签树的下行遍历: 属性 说明 .contents 子节点的列表,将<tag>所有儿子节点存入列表 .children 子节点的迭代类型,与.contents类似,用于循环遍历儿子节点 .de 阅读全文
posted @ 2018-03-25 01:03 歪胡子的日常 阅读(444) 评论(0) 推荐(0) 编辑
摘要: 爬取某图片的程序: #图片爬取全代码 import requests import os url='http://img0.dili360.com/rw9/ga/M01/4A/3D/wKgBy1p6qJ6ALyaOADWDaIwa9uw587.tub.jpg' root='D:/北理工爬虫课程/' 阅读全文
posted @ 2018-03-25 01:03 歪胡子的日常 阅读(1173) 评论(0) 推荐(0) 编辑
摘要: bs4有一个find_all(name,attrs,recursive,string,**kwargs)方法,返回一个列表类型,存储查找的结果 name 对标签名称的检索字符串 attrs 对标签属性值的检索字符串,可标注属性检索,可查找某标签中是否含有特定的字符串 recursive 是否对子孙全 阅读全文
posted @ 2018-03-25 01:02 歪胡子的日常 阅读(274) 评论(0) 推荐(0) 编辑