摘要: 正则表达式+BeautifulSoup爬取网页可事半功倍。 就拿百度贴吧网址来练练手:https://tieba.baidu.com/index.html 1.find_all():搜索当前节点的所有子节点,孙子节点。 下面例子是用find_all()匹配贴吧分类模块,href链接中带有“娱乐”两字 阅读全文
posted @ 2019-11-03 13:58 酸菜泡饭 阅读(5186) 评论(0) 推荐(0) 编辑