2021 年 5月 13 日随笔档案 - 黄某人233

摘要： pdf文件爬取首先分析此论文网站的网站结构我选取的是2018年的ECCV论文首先进入后是所有的一个论文总览然后为了实现一个自动爬取需要首先截取到他的一个链接查看后他的一个论文的所有链接都是包含在一个dl中的然后dl中有好多的dd标签和dt标签其中dt标签中是有html表示的但是是没阅读全文

posted @ 2021-05-13 21:10 黄某人233 阅读(225) 评论(0) 推荐(0) 编辑