摘要: pdf文件爬取 首先分析此论文网站的网站结构 我选取的是2018年的ECCV论文 首先进入后 是所有的一个论文总览 然后为了实现一个自动爬取 需要首先截取到他的一个链接 查看后他的一个论文的所有链接都是包含在一个dl中的 然后dl中有好多的dd标签和dt标签 其中dt标签中是有html表示的但是是没 阅读全文
posted @ 2021-05-13 21:10 黄某人233 阅读(225) 评论(0) 推荐(0) 编辑