会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
1284697607
博客园
首页
新随笔
联系
订阅
管理
2019年6月11日
爬虫概述
摘要: 1.什么是爬虫 通过编写程序模拟浏览器上网,然后让其去互联网上爬取数据的过程 2.爬虫的分类: 通用爬虫:爬取一整张页面源码数据 聚焦爬虫:爬取页面中指定的局部数据 增量式爬虫:检测网站数据更新的情况,爬取的就是网站中最新更新出来的数据。 3.反爬机制: (1)第一个反爬机制 robots.txt协
阅读全文
posted @ 2019-06-11 20:54 五仁儿
阅读(169)
评论(0)
推荐(0)
编辑
公告