摘要: 用之前所学的知识简单爬取了一个小说网站 这一次是这个网站 经过简单的爬取,前面步骤省略 可以得到这么个玩意 以及我想要的链接 下一步,开始清除标签: 此时需要借用正则表达式来进行 首先导入re库 import re 再然后运用find_all()函数来寻找div标签下面的di_=list的内容 提取 阅读全文
posted @ 2019-11-30 17:12 雾漫大武汉 阅读(1901) 评论(0) 推荐(1) 编辑