摘要: 1.首先,我们确定需要爬取的网页及robots协议,爬取的网页为最好大学网http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html,查看robots协议打开http://www.zuihaodaxue.cn/robots.txt,发现:not fou 阅读全文
posted @ 2019-11-23 21:32 木木纸 阅读(241) 评论(0) 推荐(0) 编辑