摘要: 根据上周的爬取经验,发现bs4,request等直接访问请求头的方法,很难能够爬取知网,不是找不到内容在哪里,就是访问出错,不知道是访问时携带数据的问题,还是被发现是代码访问,被拦截。 所以改变思路使用谷歌驱动器进行爬取,今天完成了第一次专辑链接的爬取。 阅读全文
posted @ 2020-09-28 14:20 集 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 本周计划完成知网爬虫,并初步搭建界面设计(学习使用SSH架构)。 阅读全文
posted @ 2020-09-28 14:17 集 阅读(103) 评论(0) 推荐(0) 编辑