2019年3月18日

概念

摘要: - 爬虫:我写的程序,能够模拟浏览器上网,还能获取数据。 - 爬虫的分类: - 通用爬虫:理解 将url对应的整张页面爬取。 - 聚焦爬虫:理解 将页面局部或者特定的内容爬取。 - 增量式爬虫: 理解 将之前爬过的内容去重,还可自己封装进行判断去重,然后进行爬取页面最新的内容。 - 反爬机制:阻止爬 阅读全文

posted @ 2019-03-18 21:28 绿豆· 阅读(96) 评论(0) 推荐(0) 编辑

导航