2021 年 5月 14 日随笔档案 - 黄某人233

摘要： pdf文件爬取昨天已经爬取了所有的超链接和标题然后现在开始拼接然后进行下一步的爬取其中已经将全部的超链接和标题保存然后进行遍历就可将全部的文件爬取首先是本地链接的拼接上一步是得到了论文的一个链接链接可以直接请求响应然后获得内容标题是作为爬取下来的pdf文件的内容文件文件名所阅读全文

posted @ 2021-05-14 21:15 黄某人233 阅读(201) 评论(0) 推荐(0) 编辑