摘要: pdf文件爬取 昨天已经爬取了所有的超链接和标题 然后现在开始拼接然后进行下一步的爬取 其中已经将全部的超链接 和 标题 保存 然后进行遍历就可将全部的文件爬取 首先 是本地链接的拼接 上一步是得到了论文的一个链接 链接可以直接请求响应然后获得内容 标题是作为爬取下来的pdf文件的内容文件文件名 所 阅读全文
posted @ 2021-05-14 21:15 黄某人233 阅读(201) 评论(0) 推荐(0) 编辑