2019 年 2月 18 日随笔档案 - 余火灬

2019年2月18日

摘要：一、爬虫协议与其它爬虫不同，全站爬虫意图爬取网站所有页面，由于爬虫对网页的爬取速度比人工浏览快几百倍，对网站服务器来说压力山大，很容易造成网站崩溃。为了避免双输的场面，大家约定，如果网站建设者不愿意爬虫访问某些页面，他就按照约定的格式，把这些页面添加到 robots.txt 文件中，爬虫应该主动阅读全文

posted @ 2019-02-18 16:53 余火灬阅读(628) 评论(0) 推荐(0) 编辑

我李逍遥要做盖世英雄

公告