摘要: 对于一个最简单的爬虫结构的代码是这样的。 也就是抓取出整个页面,然后创建一个BeautifulSoup对象。 find()和findAll() 这两个函数非常相似,是用来通过标签的不同属性来过滤HTML页面,查找需要的标签组或单个标签的。BeautifulSoup文档里两者的定义就是这样: 标签参数 阅读全文
posted @ 2018-12-04 15:27 Yingjing 阅读(1189) 评论(0) 推荐(0) 编辑